当前位置：文江博客话题详情

Pytorch out-of-memory coreference-resolution bert-language-model allennlp

AllennLP Coreference解决方案培训和替换模型的OOM问题

发布于 2025-01-30 02:09:32 字数 852 浏览 4 评论 0 原文

关于培训和评估AllennLP的核心分辨率模型，我有一些问题。

对哪些GPU进行培训有任何限制/规格吗？我通过24220 MIB内存进行了对Titan RTX GPU进行培训的中途问题。我可以更改可能会有所帮助的任何参数（注意：我正在使用 bert 而不是Spanbert版本）？
我注意到模型用法示例使用已经训练有素且存储的模型。我们可以从训练的模型中指定模型路径吗？
我们可以在 Bert-Base-uncased 替换 blob/main/main/triending_config/coref/coref_bert_lstm.jsonnet“ rel =“ nofollow noreferrer”> coref_bert-lstm.jsonnet mm.jsonnet 文件，还是进行此更改的其他修改？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

巷子口的你 2025-02-06 02:09:32

该模型需要大量内存。 max_length 参数使内存使用最大。如果您可以以比512短的最大长度逃脱，请先尝试一下。
是的，无论何时将URL到经过训练的模型，您都可以替代您训练自己的模型的当地路径。
是的，您可以，但是您必须从头开始训练模型。

回复收藏 0 原文

~没有更多了~

关于作者

初雪

暂无简介

文章

评论

28 人气

关注发私信

相关话题

更多

推荐作者

关注

十二

文章 0 评论 0

关注

飞烟轻若梦

文章 0 评论 0

关注

OPleyuhuo

文章 0 评论 0

关注

wxb0109

文章 0 评论 0

关注

旧城空念

文章 0 评论 0

关注

-小熊_

文章 0 评论 0

更多

友情链接

文江博客

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文