从非结构化文本离线生成 RDF
Open Calais 和 Alchemy API 等服务可以从非结构化文本生成 RDF。有没有可以离线执行此操作的工具?有没有人尝试过 WebCAT 或者 OpenCyc 对于这样的用…
Python 中 NLTK 的命名实体识别。识别网元
我需要将单词分类为词性。比如动词、名词、副词等等。 我用了 nltk.word_tokenize() #to identify word in a sentence nltk.pos_tag() #to identify t…
斯坦福 NER - 提取多词实体
如何在斯坦福 NER 中标记搭配?目前它标记为纽约联邦储备银行,因为 <wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entit…
使用 Google 地理编码 API 将命名实体识别标记的文件链接到 Google 地图
我有使用 NER 标记的文本文件,我需要将它们链接到 Google 地图。 <p>Gardai|NNP|O fear|VBP|O a|DT|O 28-year-old|JJ|O man|NN|O ,|,|O missing|…
如何循环多个文件,保留基本名称以供进一步处理?
我有多个需要标记化的文本文件,POS 和 NER。我正在使用 C&C 标记器并运行了他们的教程,但我我想知道是否有一种方法可以标记多个文件而不是一个一…
使用 Python 从个人地名词典中识别命名实体
我尝试使用 NLTK 在 python 中进行命名实体识别。 我想提取个人技能列表。 我有技能列表,想在申请中搜索它们并标记技能。 我注意到 NLTK 有 NER 标签…
如何使用 php 识别文本中的姓名
我想使用 php 从文本中提取姓名(名字和姓氏)。 例子: 我想从下面的文本中提取姓名(在本例中为 Aline Wright 和 Jesse Wright) 艾琳·赖特 (Aline …
具有 Python / PHP 预设名称列表的命名实体识别
我正在尝试处理一个 CSV 文件,该文件的每一行都有一个文本字段,其中包含组织名称和该组织中个人的职位作为非结构化文本。该字段通常是一团乱七八糟…
用于命名实体识别的免费标记语料库
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…