Stanza(Stanford NLP)在数据框中并行处理行时不起作用
我有一个带有800,000行的数据框,对于每行,我想在每个评论(row.comment)中找到所提到的人。我想使用stanza,因为它具有更高的精度,并且我与df.ite…
如何在使用数据集时在单独的列中提取独特的单词和POS标签
我正在使用印尼数据来使用NER数据,据我所知,没有验证的NLTK模型可以为此语言提供帮助。因此,为了手动执行此操作,我试图提取整个数据框架中使用的…
获得' o'的得分(非实体)
我正在比较自定义NER的不同Spacy V3模型,我确切知道如何使用!Spacy评估输出/模型/test.spacy.spacy 没有获得“ O”的分数。 ======================…
有可能获得Spacy实体的依赖性/POS信息吗?
我正在研究从科学文本中提取实体(我正在使用 scispacy ),后来我想使用手写规则来提取关系。我已经成功地提取了实体及其性格跨度,并且还可以获取令…
命名实体识别 (NER) 的 IOB 标记方法在模型准确性或计算时间方面是否有任何优势?
我们可以在没有 IOB 标签而仅使用实体作为标签的情况下进行 NER 吗?我专门致力于收据等视觉文档的标记分类。例如,此针对 LayoutLM 的 HuggingFace …
将卡门培尔奶酪和卡门培尔奶酪结合起来用于 token 分类的 CRF
我想结合 Camembert 和 CRF 来对法国医疗数据进行命名实体识别。 我正在遵循结合 Bert 和 CRF 的代码,但我可以'无法使用 Camembert 重现同样的事情,…
ValueError: [E143] 组件“标记器”的标签未初始化
我一直在关注这个教程 创建自定义 NER。但是,我不断收到此错误: ValueError:[E143] 组件“标记器”的标签未初始化。这可以通过调用 add_label 或通…
如何使用 Spacy v3 生成命名实体识别中的精度、召回率和 F 分数?为小型定制 NER 模型寻找 ents_p、ents_r、ents_f
下面给出了示例代码,您可以在此示例中添加一个或多个实体用于训练目的(您也可以使用带有小示例的空白模型进行演示)。我正在寻找一个用于自定义 NER…
SpaCy 3.0 - 仅微调 NER 组件,同时保持其余部分完好无损
我有一些新的 NER 标签集的训练数据,目前 SpaCy 的默认 NER 模型中未涵盖这些标签。我准备了一个 training_data.spacy 文件 - 其中专门包含带有新标…
python Spacy 自定义 NER –如何准备多词实体?
:) 请帮忙 :) 我正在使用 Spacy(空白)模型准备自定义名称实体识别。我只使用一个实体:品牌(我们可以将其命名为“ORG”作为组织)。我有一些关于 O…
训练 CamelBERT 模型进行标记分类
我正在尝试使用huggingface模型(CamelBERT)使用 ANERCorp 数据集进行标记分类。我从 ANERCorp 提供训练集来训练模型,但出现以下错误。 错误: Some…
是否有任何 NER 模型可以识别名字和姓氏而不仅仅是 PERSON?
给定一组字符串,例如: "John Doe" "Doe John" "Albert Green" "Greenshpan David" ... 我想运行一个 NER 模型来识别名字和姓氏。 我使用的所有英文…