自然语言处理的最大熵
Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 13…
扩展 HTML 字符串以具有命名字符实体
.NET 类库中是否有一种方法可以对字符串进行编码,以便将命名实体存在的任何字符替换为使用该命名实体? HttpUtility.HtmlEncode 似乎没有帮助: // R…
如何在 OpenNLP 中训练命名实体识别器标识符?
好的,我有以下代码来训练来自 OpenNLP 的 NER 标识符, FileReader fileReader = new FileReader("train.txt"); ObjectStream fileStream = new Plai…
文本挖掘 - 从非结构化文本中提取乐队名称
Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…
C/C++/Obj-C 的词性标记和命名实体识别
需要一些帮助! 我正在尝试在 Objective-C 中编写一些需要词性标记的代码,并且理想情况下还需要命名实体识别。我对“自己动手”没有太大兴趣,所以我…
从非结构化文本离线生成 RDF
Open Calais 和 Alchemy API 等服务可以从非结构化文本生成 RDF。有没有可以离线执行此操作的工具?有没有人尝试过 WebCAT 或者 OpenCyc 对于这样的用…
Python 中 NLTK 的命名实体识别。识别网元
我需要将单词分类为词性。比如动词、名词、副词等等。 我用了 nltk.word_tokenize() #to identify word in a sentence nltk.pos_tag() #to identify t…
斯坦福 NER - 提取多词实体
如何在斯坦福 NER 中标记搭配?目前它标记为纽约联邦储备银行,因为 Federal Reserve Bank of New York 我希望它被识别为 Federal Reserve Bank of Ne…
使用 Google 地理编码 API 将命名实体识别标记的文件链接到 Google 地图
我有使用 NER 标记的文本文件,我需要将它们链接到 Google 地图。 Gardai|NNP|O fear|VBP|O a|DT|O 28-year-old|JJ|O man|NN|O ,|,|O missing|VBG|O f…
如何循环多个文件,保留基本名称以供进一步处理?
我有多个需要标记化的文本文件,POS 和 NER。我正在使用 C&C 标记器并运行了他们的教程,但我我想知道是否有一种方法可以标记多个文件而不是一个一个…
使用 Python 从个人地名词典中识别命名实体
我尝试使用 NLTK 在 python 中进行命名实体识别。 我想提取个人技能列表。 我有技能列表,想在申请中搜索它们并标记技能。 我注意到 NLTK 有 NER 标签…