如何保存变压器 gpt2 的检查点以继续训练?
我正在重新训练 GPT2 语言模型,并关注此博客:
https://towardsdatascience.com/train-gpt-2-in-your-own-language-fc6ad4d60171
在这里,他们训练了GPT2 上的网络,我正在尝试重新创建一个相同的网络。但是,我的数据集太大(250Mb),所以我想继续间隔训练。换句话说,我想检查模型训练。我怎么能这样做呢?
I am retraining the GPT2 language model, and am following this blog :
https://towardsdatascience.com/train-gpt-2-in-your-own-language-fc6ad4d60171
Here, they have trained a network on GPT2, and I am trying to recreate a same. However, my dataset is too large(250Mb), so I want to continue training in intervals. In other words, I want to checkpoint the model training. How could I do this?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)