当前位置：文江博客话题详情

nlp dataset translation training-data spacy

翻译数据集用于NER Spacy模型

发布于 2025-02-08 03:08:32 字数 313 浏览 3 评论 0原文

我正在尝试培训一个模型，以识别简历。更具体地说，我正在尝试培训模型以认识教育，专业经验，技能等。我正在使用我在网上找到的简历数据集，该简历已经以spacy“ ner”模型可以识别的方式进行了格式化。但是数据集用英语，我需要法语数据。在某个时候，我可能会手动构建数据集，但是现在我将安定为翻译已经拥有的数据集。例如，让我们制造一个数据点：

[[['我去了纽约'，{entity：[11,19，位置]，[3，7，动词]}]]。数字代表第一个和最后一个字符的位置。因此，“纽约”是一个地点。

因此，这里的问题是翻译将改变，改变，对我们重要的实体的位置。那么我的问题是：有更好的方法吗？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

关于作者

嘿看小鸭子会跑

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文