Spacy Matcher 用于西班牙语文本的地址识别
我想捕获(西班牙语)法律文档中的地址,例如: import spacy from spacy.matcher import Matcher nlp=spacy.load("es_core_news_lg") texto = "... d…
将 fasttext 向量(韩语)从 fastText 导出到 spacy(UnicodeDecodeError)
大家好,我从 FastText Korean Model 下载了韩国 fasttext 模型并尝试导出使用以下代码将其变为 spacy: #!/usr/bin/env python # coding: utf8 from …
SpaCy 3.0 - 仅微调 NER 组件,同时保持其余部分完好无损
我有一些新的 NER 标签集的训练数据,目前 SpaCy 的默认 NER 模型中未涵盖这些标签。我准备了一个 training_data.spacy 文件 - 其中专门包含带有新标…
DocBin to_bytes/to_disk 被杀死
我正在处理相当大的语料库,当我尝试保存它时,我的 DocBin 对象被杀死。 to_disk 和 to_bytes 都在打印“Killed”。 我的Python知识有限,所以我不清…
未知函数注册表:“scorers”与 spacy webservice 与烧瓶
我将 spacy 与 Flask 和 Anaconda 结合使用来创建一个简单的网络服务。一切工作正常,直到今天我尝试运行我的代码。我收到此错误,但我不明白问题到底…
尝试训练 spacy 模型时出现值错误
我尝试训练一个 spacy 模型,但最近我开始出现一些错误,我收到以下错误,我希望有人帮助我解决错误 def train_model(model, train_data, optimizer, …
如何使用 spaCy 中 NER 或 EntityRuler 匹配的实体来训练 TextCategorizer?
我试图了解如何根据早期管道组件找到的命名实体(而不仅仅是原始文本)对文档进行分类。 说我有文件 “毛工资 50 美元。净工资 40 美元。税 10 美元”…
使用 Spacy 的电子邮件分类器,在尝试实现 BOW 时由于版本问题引发以下错误
我正在尝试创建具有专有类和“弓”架构的 TextCategorizer,但由于版本问题,它抛出以下错误,我的 python 版本是 3.8,我的 spacy 版本是 3.2.3,请…
当我们使用自定义分词器时,为什么 spacy morphologizer 不起作用?
我不明白为什么当我这样做时, import spacy from copy import deepcopy nlp = spacy.load("fr_core_news_lg") class MyTokenizer: def __init__(self…
SpaCy 3 -- ValueError: [E973] NER 数据的意外类型
我一直在为这个问题苦恼很久,但似乎找不到解决方案。 我想训练一个 NER 模型来识别动物和物种名称。 我创建了一个模拟训练集来测试它。但是,我不断…