nlp

nlp

文章 19 浏览 260

Spacy Model EN_CORE_WEB_LG的问题:如何防止每次运行代码下载软件包

我正在使用Spacy及其模型en_core_web_lg在Python中执行摘要。代码运行完美,根本没有错误。除此之外,我正在尝试找到一种方法来确保EN_CORE_WEB_LG如…

段念尘 2025-02-01 19:42:24 6 0

为LSTM文本生成模型编写生成器功能

我有一个用于文本生成的LSTM模型,但是当试图增加输入的数据量时,我会遇到RAM问题,因此我发现我可以使用FIT_GENERATOR函数逐步加载数据。 问题当前…

杯别 2025-02-01 19:04:45 3 0

使用深度学习或机器学习模型验证名字和姓氏

我有大约100万个名称和姓氏的数据点。 这些名称可能是有效的,例如:“ David Beckham”或“ Rockstar123”或“ New Mutant”的“ David Beckham”或…

森林迷了鹿 2025-02-01 16:13:58 2 0

熊猫,将弦乐器分成一系列的弦乐器

我在熊猫数据框中有一个列,其中其中一个是字符串数组,如下所示。 |column1 | |:--------------------------------------------------------| |['abc…

心碎的声音 2025-02-01 15:10:41 1 0

基于先前的POS标签合并令牌

我想实施一些文本操作,以作为键形提取的预处理。查看以下示例: import spacy text = "conversion of existing underground gas storage facilities …

不如归去 2025-02-01 13:15:38 7 0

Python中的键形提取 - 如何预处理文本以获得更好的性能

我正在尝试从一些英语文本中提取键形,但我认为结果的质量受句子的制定方式影响。例如: 句子1 import pke text = "Manufacture of equipment for the…

一袭水袖舞倾城 2025-02-01 11:03:20 4 0

ValueError:如果设置“请求”参数,则不应设置一个单独的字段参数

我正在使用Google NLP API进行情感分析,以评论作为我的文本列提取数据框的情感评分。我的代码看起来很喜欢, def getSentiments(df): inserts = 0 df…

菊凝晚露 2025-02-01 08:37:41 3 0

如何根据成对概率订购句子?

我正在以以下方式生成成对句子订单概率: import itertools import random import numpy as np import tensorflow as tf from transformers import Be…

微暖i 2025-02-01 08:04:35 4 0

输出bash管与Python兼容格式

我正在使用UDPipe模型进行文本令牌化和lemmatization。我可以通过使用!echo 命令或打印到文件中来完成任务本身,但是我想生成Python数据结构以进一步…

山色无中 2025-02-01 07:50:03 2 0

拥抱面长形式案例敏感令牌

此 page 显示了如何构建基于长图的分类。 import pandas as pd import datasets from transformers import LongformerTokenizerFast, LongformerForSe…

迷乱花海 2025-02-01 04:32:44 8 0

如何在numpy列表之间获得最大相似性值?

我有两个列表,其想法是,将其中一个列表的每个元素与第二个元素进行了比较,以便以最大的相似性提取元素。像搜索引擎。 NLU中使用的变量: import nu…

冷心人i 2025-02-01 03:38:23 2 0

用语料库制作一个双重表格

我正在尝试从一个包含100个句子的文本文件的语料库中制作一个biagram表,但我无法做到。现在,我只有显示该文本文件有多少句子的代码。我是机器翻译的…

裂开嘴轻声笑有多痛 2025-01-31 22:39:20 3 0

如何找到生成问题的准确性(质量)?

我创建了一个模型,该模型将从段落中产生一个问题。生成的问题存储在列表中。从此产生的问题,有些问题很好,但有些含义更少。例如 Where did Accordi…

秋风の叶未落 2025-01-31 21:34:03 2 0

NotimplementedError:不再支持Lemmatize参数

我已经为自己的类似GPT2模型运行了代码,但是以下错误已经存在。如何在Python中解决此实施错误。 corpus = WikiCorpus(file_path, lemmatize=False, l…

节枝 2025-01-31 19:31:28 4 0

将更多的自定义实体添加到预验证的自定义NER Spacy3中

我已经大量的文本数据,想增加约50个不同的实体。最初,当我开始使用它时,我会遇到内存错误。众所周知,Spacy可以处理每GB的1,00,000个令牌,最高可…

梦开始←不甜 2025-01-31 17:22:11 3 0
更多

推荐作者

櫻之舞

文章 0 评论 0

弥枳

文章 0 评论 0

m2429

文章 0 评论 0

野却迷人

文章 0 评论 0

我怀念的。

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文