第 2 页 - tokenize - 文江博客

tokenize

文章 0 浏览 7

无法理解为什么会出现此错误，

'''import collections try: collectionsAbc = collections.abc except AttributeError:`enter code here` collectionsAbc = collections from inltk…

独留℉清风醉 2025-02-06 02:02:31 3 0

为什么拥抱面Tokenizer仅返回1`input_ids'而不是3？

我正在尝试将 squead 数据集遵循 hugginggingface tutorial ： from datasets import load_dataset from transformers import RobertaTokenizer from …

半透明的墙 2025-02-02 03:20:19 6 0

XSL分组与变量

我在XML元素中有以下字符串： ENER-|APPROXIMATELY||120|E14++ENER-|APPROXIMATELY||501|KJO++PRO-|APPROXIMATELY||6.6|GRM++CHOAVL|APPROXIMATELY||6…

过气美图社 2025-02-01 10:56:50 4 0

象征化后的句子测序不正确

我正在使用这些数据在这里称为女子电子企业E-Commerce Chiew，通过应用这个想法来将功能合并到文本中，来自这里用于NLP学习。 tokenizer = Tokenize…

情域 2025-01-31 05:39:17 2 0

使用REGEX自定义令牌化

我有以下文本： 4/21/2021 11:43:32 PM 0ED4 PACKET [OUTPUT] GET 日志行的格式可能会更改，并且可能会添加更多字段，但它们都是单个单词。我只想加入…

拥抱我好吗 2025-01-31 04:56:45 2 0

为什么使用NLTK以外的其他语言可以用其他语言来tokenize文本？

我正在尝试使用 Word.tokenize 从 nltk.tokenize 使用 word.tokenize 。我发现的是，无论我选择哪种语言，无论我尝试使用的字符串是什么语言，都将默…

丶视觉 2025-01-30 06:29:45 1 0

如何在XML中对句子进行象征化并创建新的子节点？

我有看起来像这样的XML： काकेशिया में तब लड़ाई потом боевые действия на Кавказе ... ... 我想通…

留蓝 2025-01-27 01:36:40 2 0

将std :: string to to struct to struct

假设我有以下我想按下定界符'＆gt;'的字符串： std::string veg = "orange>kiwi>apple>potato"; 我希望将字符串中的每个项目放在具有以下格式的结构中…

×眷恋的温暖 2025-01-26 19:29:33 3 0

KWIC（）函数返回的行比应有

我目前正在尝试对 kwic 对象进行情感分析，但恐怕 kwic（）函数不会返回所有应该返回的行。我不太确定问题到底是什么使得很难发布一个可再现的例子，…

ぺ禁宫浮华殁 2025-01-26 16:12:20 5 0

如何在nltk.corpus.words.words（）中求解丢失的单词？

我试图从文本中删除非英语单词。问题是许多其他单词来自NLTK单词语料库。我的代码： import pandas as pd lst = ['I have equipped my house with a …

那一片橙海， 2025-01-25 21:02:15 4 0

如何在熊猫中正确地将柱子列为列？

我正在尝试通过社交媒体的评论来解决数据集中的令牌化问题。我想从熊猫列中象征性，诱饵，删除标点和停车词。我正在为每个评论做如何做。试图获取令牌…

还不是爱你 2025-01-25 15:58:27 3 0

启动时用标签在子字符串中的最佳标记单词在＆amp;提供结尾指数[Python]

我正在尝试以串联格式格式化数据以进行NER任务（此信息在很大程度上无关紧要）。我要最佳实现的是 - 输入： text：快速棕色狐狸跳过懒惰的狗。 indice…

破晓 2025-01-24 13:30:01 3 0

Spacy vs NLTK Word Tokenize基准测试

[我的代码] [1] 导入nltk导入spacy nlp = spacy.load（“ en_core_web_sm”，disable = ['parser'，'ner'，'tok2vec'，'tagger'，'attribute_ruler' .…

雾里花 2025-01-23 16:19:14 2 0

从一系列句子的单个句子diskenize

我有一个任务问题，我必须在其中找到一种方法来从一串句子中对单个句子进行描述。句子是由完整停止终止的任何单词序列（包括完整的停止本身）。如果…

甜是你 2025-01-23 08:22:56 3 0

在C＆＃x2B;＆＃x2b;中解析（拆分）字符串使用字符串定界符（标准C＆＃x2B;＆＃x2B;）

我使用以下内容在C ++中解析一个字符串： using namespace std; string parsed,input="text to be parsed"; stringstream input_stringstream(input);…

娇纵 2025-01-22 00:18:18 5 0

共 21 页
上一页
1
2
3
4
5
下一页

友情链接

文江博客

tokenize

无法理解为什么会出现此错误，

为什么拥抱面Tokenizer仅返回1`input_ids'而不是3？

XSL分组与变量

象征化后的句子测序不正确

使用REGEX自定义令牌化

为什么使用NLTK以外的其他语言可以用其他语言来tokenize文本？

如何在XML中对句子进行象征化并创建新的子节点？

将std :: string to to struct to struct

KWIC（）函数返回的行比应有

如何在nltk.corpus.words.words（）中求解丢失的单词？

如何在熊猫中正确地将柱子列为列？

启动时用标签在子字符串中的最佳标记单词在＆amp;提供结尾指数[Python]

Spacy vs NLTK Word Tokenize基准测试

从一系列句子的单个句子diskenize

在C＆＃x2B;＆＃x2b;中解析（拆分）字符串使用字符串定界符（标准C＆＃x2B;＆＃x2B;）

热门标签

推荐作者

达拉崩吧

PANGOO

kkgtx

WordPress小学生

酷炫老祖宗

硪扪都還晓

友情链接