在 spacy 中保存和加载 nlp 结果
我想使用 SpaCy 分析许多小文本,并且想存储 nlp 结果以供进一步使用以节省处理时间。我在存储和加载包含词向量的spaCy文档中找到了代码但我收到错误…
如何提高 Spacy 相似度计算的速度?
Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…
如何使用 spaCy 中 NER 或 EntityRuler 匹配的实体来训练 TextCategorizer?
我试图了解如何根据早期管道组件找到的命名实体(而不仅仅是原始文本)对文档进行分类。 说我有文件 “毛工资 50 美元。净工资 40 美元。税 10 美元”…
将命名实体与 spaCy 的 Matcher 模块合并
def match_patterns(cleanests_post): mark_rutte = [ [{"LOWER": "mark", 'OP': '?'}, {"LOWER": "rutte", 'OP': '?'}], [{"LOWER": "markie"}] ] ma…
spacy.load 错误:RuntimeError:字典在迭代期间更改了大小
我正在加载 spaCy 模型,作为我的 Dataflow 流传输管道中步骤的一部分。加载我正在使用的特定语言的预下载 spaCy 模型 nlp_model = spacy.load(SPACY_…
Python spacy 模块无法在 Apache 上运行
我有一个在 Windows 中的 Apache24 上运行的 Django 应用程序。我正在使用Python 3.9.5。该应用程序运行良好。但是,在安装 spacy 模块并将其导入到 P…
使用 Spacy 的电子邮件分类器,在尝试实现 BOW 时由于版本问题引发以下错误
我正在尝试创建具有专有类和“弓”架构的 TextCategorizer,但由于版本问题,它抛出以下错误,我的 python 版本是 3.8,我的 spacy 版本是 3.2.3,请…
在 Python 3.9 中使用 Spacy 从数据框中删除名称
我正在 Python 3.9 中使用 spacy 包 v3.2.1,并想了解如何使用它从数据框中删除名称。我尝试遵循 spacy 文档,并且能够正确识别名称,但不明白如何删…
提取 SpaCy DATE 实体并添加到新的 pandas 列
我收集了一些社交媒体评论,我想根据它们对日期的引用进行探索。为此,我使用 SpaCy 的命名实体识别器来搜索 DATE 实体。我在 comment 列下的名为 df_…
自定义 sklearn Pipeline 来转换 X 和 y
我创建了自己的文本处理自定义管道。在 .transform() 方法中,我想如果没有标记则删除目标行。 class SpacyVectorizer(BaseEstimator, TransformerMix…
当我们使用自定义分词器时,为什么 spacy morphologizer 不起作用?
我不明白为什么当我这样做时, import spacy from copy import deepcopy nlp = spacy.load("fr_core_news_lg") class MyTokenizer: def __init__(self…
如何使用带有模式的 spacy 从简历中提取准确的人名
我正在使用 spacy 模型 en_core_web_sm 从简历中提取人名,并使用类似的 spacy 模式, PATTERN = [ [{'POS': 'PROPN'}, {'POS': 'PROPN'}, {'POS': 'P…
Spacy加载自定义语言模型
我有一个保加利亚语的定制模型。我通过运行将其打包: !spacy package ./models_custom_bg/model-best/ packages --name custom_bg --version 0.0.1 -…
- 共 1 页
- 1