具有音频功能的 Transformer(Multi-Head-Attention),Val 精度始终相同
我在创建变压器模型时遇到一些问题。无论我如何更改参数,我总是能获得 11.86% 的验证准确率,如果我仅使用 1 个输入训练模型,这一准确率甚至不会改…
Huggingface 模型的 OSError
我正在尝试使用 Huggingface 模型(CamelBERT),但是加载分词器时出现错误: 代码: from transformers import AutoTokenizer, AutoModelForMaskedLM…
有没有办法修改corsera的人脸识别分配?
我尝试使用 coursera 人脸识别课程中提供的代码在我输入的输入图像上使用它,但效果不太好! 代码链接: https://www.coursera.org/learn/convolution…
使用 keras 子类化时遇到错误
我正在使用张量流训练图像标题生成器。我使用变压器来制作字幕。但是在调用train_step()时出现错误。 class Transformer(tf.keras.Model): def __init…
Pytorch:如何为 CNN 制作自定义数据加载器?
我正在尝试从 CNN 的自定义数据集创建自己的数据加载器。原始的 Dataloader 是通过以下方式创建的: train_loader = torch.utils.data.DataLoader(mni…
相同的输入、相同的模型、相同的权重但得到不同的结果
我正在微调句子 bert 来完成一些任务,例如在 Tensorflow 中计算句子余弦相似度。我使用以下代码设置了一个编码器,例如 encoder1: from sentence_tr…
为什么在Python中使用张量流的ANFIS模型中精度、召回率为零
我已经用张量流构建了 AFIS 模型来解决分类问题。对于每个时期,我的精确度和召回率都为零。我正在使用 guassian 隶属函数,但是当我打印 sigma 时,…
使用 flax.nn.Module 实现 RNN
我正在尝试使用 flax.nn.Module 实现基本的 RNN 单元。实现 RNN 单元的方程非常简单: a_t = W * h_{t-1} + U * x_t + b h_t = tanh(a_t) o_t = V * h…
PyTorch 相当于 keras 模型
我正在学习 PyTorch,并尝试将 yolov3 模型(来自 keras)转换为 PyTorch。现在我面临的问题是有一个代码片段我发现很难将其转换为 PyTorch。现在 def…
如何保存 pytorch 生成对抗网络生成的图像?
我严格遵循了 DCGAN 上的 Pytorch 教程,我成功地生成了图像,但是我无法单独提取生成的图像,它们仅在马赛克中生成。 有没有办法将生成的图像一张一…
预测神经网络中的 Y 变量给出相同的数字
我想使用一个神经网络,其中变量 X 有 50 行和 5 列,变量 Y 有 5 个不同的值(类别)。 下面是使用 softmax 的代码,因为有 5 个类,但预测值始终是…
无法在 GPU 中训练 PyTorch 模型。不断收到张量不在同一设备上的错误
我一直试图在 GPU 中训练我的 PyTorch 模型。该模型在 CPU 中完美运行。我一直使用Google Colab的GPU资源来使用cuda。 我知道为了在 GPU 中运行模型,…