当前位置：文江博客话题详情

结合BERT和其他类型的嵌入

发布于 2025-01-30 12:08:20 字数 343 浏览 5 评论 0 原文

Flair模型可以给出任何单词的表示（它可以处理OOV问题），而BERT模型将未知的单词分为几个子字。

例如，“ hjik”一词将在Flair中代表一个向量，而在Bert中，它将分为几个单词（因为它是OOV），因此我们将为每个子单词都有几个向量。因此，从弗莱尔（Flair）那里，我们将有一个向量，而从伯特（Bert）我们可能有两个或多个向量。

这里的问题是 flairnlp 库库处理此问题？

注意：如果您不知道，您至少可以建议我一种适当的处理方法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

旧城空念 2025-02-06 12:08:20

Transformerwordembeddings类的默认文字分为多个子字，您可以使用subtoken_pooling参数控制多个子字（您的选择是“ first”，“ first”，“ last”，“ first_last”和“ mean”），请参见此处的信息：

回复收藏 0 原文

~没有更多了~

关于作者

○闲身

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

结合BERT和其他类型的嵌入

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

佚名

今天

゛时过境迁

达拉崩吧

呆萌少年

孤者何惧

友情链接

结合BERT和其他类型的嵌入

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

佚名

今天

゛时过境迁

达拉崩吧

呆萌少年

孤者何惧

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。