tokenize

文章 0 浏览 7

nltk punktsentenceTokenizer：介于两者之间的diskenize句子

是否可以使 nltk from nltk.tokenize.punkt import PunktSentenceTokenizer sent_tokenizer = PunktSentenceTokenizer() print(sent_tokenizer.tokeni…

惟欲睡 2025-02-14 01:34:27 1 0

NLP模型的Heroku部署显示错误（应用程序在本地运行良好）

我已经在Heroku上部署了烧瓶应用程序（NLP型号）。我基本上是一个价格预测模型，其中一些列在日语中，我将NLP + Nagisa库用于令牌化，而某些列是数值…

奶气 2025-02-13 00:51:46 2 0

fn for-each循环：令牌

我想将变量的值，令牌化和循环通过不同的令牌。我的解决方案无法正常工作。我必须误解tokenize（）实际上做什么。 1.2.3.4 预期：实际：在＆lt; xs…

北方的巷 2025-02-12 15:07:59 3 0

属性错误：＆＃x27; tokenizer＆＃x27;对象没有属性＆＃x27;分析仪＆＃x27;

def generate_desc(model, tokenizer, photo, max_length): # seed the generation process in_text = 'startseq' # iterate over the whole length o…

挽手叙旧 2025-02-12 10:31:16 2 0

XSLT 2.0 3.0 for-EAK上下文错误时属性属性时

给定此XML，我想将属性 @cautionrefs （和 @warningrefs ），然后找到与其匹配的 codiate> coce> caution> @id 到令牌化值：但是应用程序失败：转换…

喵星人汪星人 2025-02-12 05:17:31 2 0

Solr Tokenizer无需做任何事情

我想将一个solr字符串字段“ content”归为“一个sikenized”。因此，例如： { "content":"Hello World this is a Test", "tokenized":["hello", "wo…

等数载，海棠开 2025-02-11 21:12:52 3 0

从c中的字符串中删除最常见的单词

我需要从C中的字符串中删除所有最常见单词的出现。如果文本中有几个单词重复相同的次数字符串。省略单词时，您不应省略周围空间和其他字符。如果接收…

心的位置 2025-02-10 11:06:40 2 0

将新列添加到字典中的拥抱表数据集中

我有一个标题为“ tokenized_datasets” 的数据集，如下：我想添加一个名为 ['labels'] 的列，它是一个副本 ['input_ids'] 在功能中。我知道这篇文章…

终陌 2025-02-10 07:10:58 3 0

如何使用strsep（）来象征字符串

我有一个内核模块，在模块中，我正在尝试使用 strep（）拆分字符串。我有以下解密变量，其中包含我要拆分的字符串。 unsigned char decrypt[KEY_SIZE]…

谁把谁当真 2025-02-09 23:30:25 2 0

struct在普通的G＆＃x2B;＆＃x2b;，中的工作中工作

我在QT中做了一个计算器GUI，并单独做出了一个可以使C ++中的计算的函数，但是在尝试将两者与 .h 文件结合起来后，我得到了错误：> 每当我使用struct…

So要识趣 2025-02-09 19:13:32 1 0

tokenizer.texts_to_sepences（keras tokenizer）给出相同的预测

看起来 tokenizer.toxts_texts_tox_to_to_sequencess_to_to_sepencess_to_to_sequessections 但这不是。我正在努力创建一个文本分类代码，但我正在使…

话少心凉 2025-02-09 02:23:12 2 0

为什么HF_TASKS_AUTO未从Fastai识别？

这是我这样做的 !pip install ohmeow-blurr==0.0.6 !pip install datasets==1.3.0 -qq !pip install fsspec==2021.7.0 是我尝试使用fastai2的库导入的…

眼波传意 2025-02-08 16:30:08 3 0

不同的象征器之间的翻译

抱歉，这个问题太基本了，以至于在这里问。我尝试过，但找不到解决方案。我现在正在研究一个NLP项目，该项目需要使用两个不同的模型（用于摘要的BART…

烟酒忠诚 2025-02-07 10:15:52 3 0

如何使用MT5使用自定义令牌？

我想通过说我是ML的新手来序言。我试图将MT5用作练习。我为MT培训了MT5型号，但现在想使用自定义令牌。我已经预先制作了一个BPE令牌，并根据 hugging…

岁月染过的梦 2025-02-07 00:56:05 2 0

令牌仪的词汇应该是什么？

我正在尝试使用HuggingFace的令牌器。但是，我没有词汇。 from tokenizers import BertWordPieceTokenizer , CharBPETokenizer, ByteLevelBPETokenize…

萧瑟寒风 2025-02-06 13:30:40 4 0

共 21 页
1
2
3
4
5
下一页

友情链接

文江博客