当前位置：文江博客话题详情

文本挖掘 - 从非结构化文本中提取乐队名称

发布于 2024-11-19 11:57:10 字数 1435 浏览 11 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

原来分手还会想你 2024-11-26 11:57:10

由于数据的结构，预先训练的模型可能表现不佳。此外，一般的组织、位置和人员类别可能对您没有用处。

我不认为文本本身太小，大多数 NER 系统一次只处理一个句子。因此，为您自己的训练集提供 NER 库可能会效果很好，例如 http://nlp .stanford.edu/ner/index.shtml

如果您不想创建训练集，您将需要一本包含所有乐队/艺术家的字典。那么你显然找不到不知名的乐队/艺术家。

回复收藏 0 原文

等风来 2024-11-26 11:57:10

有一个简单的 NER 算法可以稍微简化任务：
获取可能是（或不是）命名实体的单词，并在 Google 或 Yahoo（通过 API）中搜索它们两次：作为单独的单词和作为精确短语（即带引号）。除以结果数。存在确定单词是否形成命名实体的阈值（＜30）。

回复收藏 0 原文

~没有更多了~

关于作者

若沐

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

文本挖掘 - 从非结构化文本中提取乐队名称

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_VRzBBA45

痴情

。

Mu.

凉薄对峙

不落城

友情链接

文本挖掘 - 从非结构化文本中提取乐队名称

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

qq_VRzBBA45

痴情

。

Mu.

凉薄对峙

不落城

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。