OpenAI GPT-3 API:微调微调模型?
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题吗?更新该问题,以便可以通过。 闭合 12个月前…
如何finetune torchvision.models.detection.ssd300_vgg16?
我需要使用pytorch微调对象检测算法。所有可用的教程都进行实例细分。加载的任何指南或代码示例: 型号= torchvision.models.detection.ssd300_vgg16…
gpt-j和gpt-neo产生的句子太长
Closed. This question is not about programming or software development. It is not currently accepting answers. 这个问题似乎并不是关于特定的…
MXNET-如何将辍学层添加到RESNET_V1预验证的模型
我试图在MXNET:RESNET50_V1中验证一个预算的模型。 该模型没有辍学,我想添加它以避免过度拟合,并使其看起来与i3d_resnet50_v1_kinetics400的最后一…
我可以为OpenAI API Codex模型创建微调模型吗?
我想将用户请求转换为某种结构化数据格式的门票,例如JSON。例如: 用户:我想订购两把椅子和一张桌子,左侧有三个抽屉。 输出: { "type": "furnitur…
加载保存的型号在填充时不像预期的那样行事
我训练了一个 pytorch 模型,第一个 epoch 结束时的准确度为 20%,损失值为 3.8 。我训练它直到损失为 3.2 并且准确度约为 50% 并像这样保存: torch.…
在 eletra 模型上添加图层时使用拥抱面部训练器进行微调
我试图通过拥抱的面部训练器模块来微调自己的模型。直到仅训练ElectraforquestionAnswering,才有问题,但是我尝试在模型上添加其他层并尝试了相同的…
Torchvision RetinaNet 预测不需要的班级背景
我想用我的自定义数据集和 2 个类(无背景)训练来自 torchvision 的预训练 RetinaNet。为了使用 RetinaNet 进行训练,我做了以下修改: num_classes …
我可以在colab中清理GPU显存吗
我正在尝试使用 aitextgen 在数据集上微调 774M gpt 2。不幸的是,无论我做什么,训练都会失败,因为只有 80 MB 的 vram 可用。如何在不重新启动运行…
- 共 1 页
- 1