tokenize

tokenize

文章 0 浏览 7

无法理解为什么会出现此错误,

'''import collections try: collectionsAbc = collections.abc except AttributeError:`enter code here` collectionsAbc = collections from inltk…

独留℉清风醉 2025-02-06 02:02:31 3 0

为什么拥抱面Tokenizer仅返回1`input_ids'而不是3?

我正在尝试将 squead 数据集遵循 hugginggingface tutorial : from datasets import load_dataset from transformers import RobertaTokenizer from …

半透明的墙 2025-02-02 03:20:19 6 0

XSL分组与变量

我在XML元素中有以下字符串: ENER-|APPROXIMATELY||120|E14++ENER-|APPROXIMATELY||501|KJO++PRO-|APPROXIMATELY||6.6|GRM++CHOAVL|APPROXIMATELY||6…

过气美图社 2025-02-01 10:56:50 4 0

象征化后的句子测序不正确

我正在使用这些数据 在这里 称为女子电子企业E-Commerce Chiew,通过应用这个想法来将功能合并到文本中,来自这里用于NLP学习。 tokenizer = Tokenize…

情域 2025-01-31 05:39:17 2 0

使用REGEX自定义令牌化

我有以下文本: 4/21/2021 11:43:32 PM 0ED4 PACKET [OUTPUT] GET 日志行的格式可能会更改,并且可能会添加更多字段,但它们都是单个单词。我只想加入…

拥抱我好吗 2025-01-31 04:56:45 2 0

为什么使用NLTK以外的其他语言可以用其他语言来tokenize文本?

我正在尝试使用 Word.tokenize 从 nltk.tokenize 使用 word.tokenize 。我发现的是,无论我选择哪种语言,无论我尝试使用的字符串是什么语言,都将默…

丶视觉 2025-01-30 06:29:45 1 0

如何在XML中对句子进行象征化并创建新的子节点?

我有看起来像这样的XML: काकेशिया में तब लड़ाई потом боевые действия на Кавказе ... ... 我想通…

留蓝 2025-01-27 01:36:40 2 0

将std :: string to to struct to struct

假设我有以下我想按下定界符'>'的字符串: std::string veg = "orange>kiwi>apple>potato"; 我希望将字符串中的每个项目放在具有以下格式的结构中…

×眷恋的温暖 2025-01-26 19:29:33 3 0

KWIC()函数返回的行比应有

我目前正在尝试对 kwic 对象进行情感分析,但恐怕 kwic()函数不会返回所有应该返回的行。我不太确定问题到底是什么使得很难发布一个可再现的例子,…

ぺ禁宫浮华殁 2025-01-26 16:12:20 5 0

如何在nltk.corpus.words.words()中求解丢失的单词?

我试图从文本中删除非英语单词。问题是许多其他单词来自NLTK单词语料库。 我的代码: import pandas as pd lst = ['I have equipped my house with a …

那一片橙海, 2025-01-25 21:02:15 4 0

如何在熊猫中正确地将柱子列为列?

我正在尝试通过社交媒体的评论来解决数据集中的令牌化问题。我想从熊猫列中象征性,诱饵,删除标点和停车词。我正在为每个评论做如何做。试图获取令牌…

还不是爱你 2025-01-25 15:58:27 3 0

启动时用标签在子字符串中的最佳标记单词在&提供结尾指数[Python]

我正在尝试以串联格式格式化数据以进行NER任务(此信息在很大程度上无关紧要)。我要最佳实现的是 - 输入: text:快速棕色狐狸跳过懒惰的狗。 indice…

破晓 2025-01-24 13:30:01 3 0

Spacy vs NLTK Word Tokenize基准测试

[我的代码] [1] 导入nltk导入spacy nlp = spacy.load(“ en_core_web_sm”,disable = ['parser','ner','tok2vec','tagger','attribute_ruler' .…

雾里花 2025-01-23 16:19:14 2 0

从一系列句子的单个句子diskenize

我有一个任务问题,我必须在其中找到一种方法来从一串句子中对单个句子进行描述。句子是由完整停止终止的任何单词序列(包括完整的停止本身)。 如果…

甜是你 2025-01-23 08:22:56 3 0

在C++中解析(拆分)字符串使用字符串定界符(标准C++)

我使用以下内容在C ++中解析一个字符串: using namespace std; string parsed,input="text to be parsed"; stringstream input_stringstream(input);…

娇纵 2025-01-22 00:18:18 5 0
更多

推荐作者

达拉崩吧

文章 0 评论 0

PANGOO

文章 0 评论 0

kkgtx

文章 0 评论 0

WordPress小学生

文章 0 评论 0

酷炫老祖宗

文章 0 评论 0

硪扪都還晓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文