第 11 页 - nlp - 文江博客

投稿关注

nlp

文章 19 浏览 260

Spacy Model EN_CORE_WEB_LG的问题：如何防止每次运行代码下载软件包

我正在使用Spacy及其模型en_core_web_lg在Python中执行摘要。代码运行完美，根本没有错误。除此之外，我正在尝试找到一种方法来确保EN_CORE_WEB_LG如…

段念尘 2025-02-01 19:42:24 6 0

为LSTM文本生成模型编写生成器功能

我有一个用于文本生成的LSTM模型，但是当试图增加输入的数据量时，我会遇到RAM问题，因此我发现我可以使用FIT_GENERATOR函数逐步加载数据。问题当前…

杯别 2025-02-01 19:04:45 3 0

使用深度学习或机器学习模型验证名字和姓氏

我有大约100万个名称和姓氏的数据点。这些名称可能是有效的，例如：“ David Beckham”或“ Rockstar123”或“ New Mutant”的“ David Beckham”或…

森林迷了鹿 2025-02-01 16:13:58 2 0

熊猫，将弦乐器分成一系列的弦乐器

我在熊猫数据框中有一个列，其中其中一个是字符串数组，如下所示。 |column1 | |:--------------------------------------------------------| |['abc…

心碎的声音 2025-02-01 15:10:41 1 0

基于先前的POS标签合并令牌

我想实施一些文本操作，以作为键形提取的预处理。查看以下示例： import spacy text = "conversion of existing underground gas storage facilities …

不如归去 2025-02-01 13:15:38 7 0

Python中的键形提取 - 如何预处理文本以获得更好的性能

我正在尝试从一些英语文本中提取键形，但我认为结果的质量受句子的制定方式影响。例如：句子1 import pke text = "Manufacture of equipment for the…

一袭水袖舞倾城 2025-02-01 11:03:20 4 0

ValueError：如果设置“请求”参数，则不应设置一个单独的字段参数

我正在使用Google NLP API进行情感分析，以评论作为我的文本列提取数据框的情感评分。我的代码看起来很喜欢， def getSentiments(df): inserts = 0 df…

菊凝晚露 2025-02-01 08:37:41 3 0

如何根据成对概率订购句子？

我正在以以下方式生成成对句子订单概率： import itertools import random import numpy as np import tensorflow as tf from transformers import Be…

微暖i 2025-02-01 08:04:35 4 0

输出bash管与Python兼容格式

我正在使用UDPipe模型进行文本令牌化和lemmatization。我可以通过使用！echo 命令或打印到文件中来完成任务本身，但是我想生成Python数据结构以进一步…

山色无中 2025-02-01 07:50:03 2 0

拥抱面长形式案例敏感令牌

此 page 显示了如何构建基于长图的分类。 import pandas as pd import datasets from transformers import LongformerTokenizerFast, LongformerForSe…

迷乱花海 2025-02-01 04:32:44 8 0

如何在numpy列表之间获得最大相似性值？

我有两个列表，其想法是，将其中一个列表的每个元素与第二个元素进行了比较，以便以最大的相似性提取元素。像搜索引擎。 NLU中使用的变量： import nu…

冷心人i 2025-02-01 03:38:23 2 0

用语料库制作一个双重表格

我正在尝试从一个包含100个句子的文本文件的语料库中制作一个biagram表，但我无法做到。现在，我只有显示该文本文件有多少句子的代码。我是机器翻译的…

裂开嘴轻声笑有多痛 2025-01-31 22:39:20 3 0

如何找到生成问题的准确性（质量）？

我创建了一个模型，该模型将从段落中产生一个问题。生成的问题存储在列表中。从此产生的问题，有些问题很好，但有些含义更少。例如 Where did Accordi…

秋风の叶未落 2025-01-31 21:34:03 2 0

NotimplementedError：不再支持Lemmatize参数

我已经为自己的类似GPT2模型运行了代码，但是以下错误已经存在。如何在Python中解决此实施错误。 corpus = WikiCorpus(file_path, lemmatize=False, l…

节枝 2025-01-31 19:31:28 4 0

将更多的自定义实体添加到预验证的自定义NER Spacy3中

我已经大量的文本数据，想增加约50个不同的实体。最初，当我开始使用它时，我会遇到内存错误。众所周知，Spacy可以处理每GB的1,00,000个令牌，最高可…

梦开始←不甜 2025-01-31 17:22:11 3 0

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

nlp

Spacy Model EN_CORE_WEB_LG的问题：如何防止每次运行代码下载软件包

为LSTM文本生成模型编写生成器功能

使用深度学习或机器学习模型验证名字和姓氏

熊猫，将弦乐器分成一系列的弦乐器

基于先前的POS标签合并令牌

Python中的键形提取 - 如何预处理文本以获得更好的性能

ValueError：如果设置“请求”参数，则不应设置一个单独的字段参数

如何根据成对概率订购句子？

输出bash管与Python兼容格式

拥抱面长形式案例敏感令牌

如何在numpy列表之间获得最大相似性值？

用语料库制作一个双重表格

如何找到生成问题的准确性（质量）？

NotimplementedError：不再支持Lemmatize参数

将更多的自定义实体添加到预验证的自定义NER Spacy3中

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接