输入 0 与层 Repeat_vector_40 不兼容:预期 ndim=2,发现 ndim=1
我正在开发用于异常检测的 LSTM 自动编码器模型。我的 keras 模型设置如下: from keras.models import Sequential from keras import Model, layers …
多头注意力中的多个头实际上会导致更多的参数或不同的输出吗?
我正在尝试理解变形金刚。虽然我理解编码器-解码器结构的概念以及自我注意背后的想法,但我所坚持的是“多头注意层”的“多头部分”。 看看这个解释 h…
- 共 1 页
- 1