如何选择FairSeq选项`-ddp-backend`
我正在学习如何使用
fairseq
实现基于简单的翻译模型在变压器上。
我想在实验室服务器上使用2 GEFORCE RTX 3090 GPU。我应该选择的哪个选项 -
? fairseq-train
的ddp-backend
此外,您能否解释的所有以下选项的含义-DDP-Backend
以及何时使用它们的含义?
来自 FairSeq-Train => distribute_training
- DDP-BAKEND
:可能的选择:c10d,firls_sharded,legacy_ddp,no_c10d,pytorch_ddp,slowmo
distribationdataparallear后端
默认值:“ pytorch_ddp”
distributeddataPararallearpallelallearlallearallearlallelalearder 有任何不当行动。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
我不太确定,但是我在
可能会有所帮助,但我也在努力
I am not too sure, but I found this on GitHub
Might be helpful, but I am also struggling with this
您可以在options.py文件中找到它,希望它有用。但是他们只描述了“ C10D”和“ NO_C10D”之间的区别。因此,我们应该继续寻找更多。
这是
You can find this in the options.py file, hope it's helpful. But they only describe the difference between "c10d" and "no_c10d". So we should keep going to find more.
This is the link.