tokenize

tokenize

文章 0 浏览 7

nltk punktsentenceTokenizer:介于两者之间的diskenize句子

是否可以使 nltk from nltk.tokenize.punkt import PunktSentenceTokenizer sent_tokenizer = PunktSentenceTokenizer() print(sent_tokenizer.tokeni…

惟欲睡 2025-02-14 01:34:27 1 0

NLP模型的Heroku部署显示错误(应用程序在本地运行良好)

我已经在Heroku上部署了烧瓶应用程序(NLP型号)。我基本上是一个价格预测模型,其中一些列在日语中,我将NLP + Nagisa库用于令牌化,而某些列是数值…

奶气 2025-02-13 00:51:46 2 0

fn for-each循环:令牌

我想将变量的值,令牌化和循环通过不同的令牌。 我的解决方案无法正常工作。我必须误解tokenize()实际上做什么。 1.2.3.4 预期: 实际: 在< xs…

北方的巷 2025-02-12 15:07:59 3 0

属性错误:' tokenizer'对象没有属性'分析仪'

def generate_desc(model, tokenizer, photo, max_length): # seed the generation process in_text = 'startseq' # iterate over the whole length o…

挽手叙旧 2025-02-12 10:31:16 2 0

XSLT 2.0 3.0 for-EAK上下文错误时属性属性时

给定此XML, 我想将属性 @cautionrefs (和 @warningrefs ),然后找到与其匹配的 codiate> coce> caution> @id 到令牌化值: 但是应用程序失败:转换…

喵星人汪星人 2025-02-12 05:17:31 2 0

Solr Tokenizer无需做任何事情

我想将一个solr字符串字段“ content”归为“一个sikenized”。 因此,例如: { "content":"Hello World this is a Test", "tokenized":["hello", "wo…

等数载,海棠开 2025-02-11 21:12:52 3 0

从c中的字符串中删除最常见的单词

我需要从C中的字符串中删除所有最常见单词的出现。 如果文本中有几个单词重复相同的次数字符串。省略单词时,您不应省略周围空间和其他字符。如果接收…

心的位置 2025-02-10 11:06:40 2 0

将新列添加到字典中的拥抱表数据集中

我有一个标题为“ tokenized_datasets” 的数据集,如下: 我想添加一个名为 ['labels'] 的列,它是一个副本 ['input_ids'] 在功能中。我知道这篇文章…

终陌 2025-02-10 07:10:58 3 0

如何使用strsep()来象征字符串

我有一个内核模块,在模块中,我正在尝试使用 strep()拆分字符串。我有以下解密变量,其中包含我要拆分的字符串。 unsigned char decrypt[KEY_SIZE]…

谁把谁当真 2025-02-09 23:30:25 2 0

struct在普通的G++,中的工作中工作

我在QT中做了一个计算器GUI,并单独做出了一个可以使C ++中的计算的函数,但是在尝试将两者与 .h 文件结合起来后,我得到了错误:> 每当我使用struct…

So要识趣 2025-02-09 19:13:32 1 0

tokenizer.texts_to_sepences(keras tokenizer)给出相同的预测

看起来 tokenizer.toxts_texts_tox_to_to_sequencess_to_to_sepencess_to_to_sequessections 但这不是。 我正在努力创建一个文本分类代码,但我正在使…

话少心凉 2025-02-09 02:23:12 2 0

为什么HF_TASKS_AUTO未从Fastai识别?

这是我这样做的 !pip install ohmeow-blurr==0.0.6 !pip install datasets==1.3.0 -qq !pip install fsspec==2021.7.0 是我尝试使用fastai2的库导入的…

眼波传意 2025-02-08 16:30:08 3 0

不同的象征器之间的翻译

抱歉,这个问题太基本了,以至于在这里问。我尝试过,但找不到解决方案。 我现在正在研究一个NLP项目,该项目需要使用两个不同的模型(用于摘要的BART…

烟酒忠诚 2025-02-07 10:15:52 3 0

如何使用MT5使用自定义令牌?

我想通过说我是ML的新手来序言。我试图将MT5用作练习。 我为MT培训了MT5型号,但现在想使用自定义令牌。我已经预先制作了一个BPE令牌,并根据 hugging…

岁月染过的梦 2025-02-07 00:56:05 2 0

令牌仪的词汇应该是什么?

我正在尝试使用HuggingFace的令牌器。但是,我没有词汇。 from tokenizers import BertWordPieceTokenizer , CharBPETokenizer, ByteLevelBPETokenize…

萧瑟寒风 2025-02-06 13:30:40 4 0
更多

推荐作者

5040234068

文章 0 评论 0

樱花雨梦

文章 0 评论 0

≈。彩虹

文章 0 评论 0

雨轻弹

文章 0 评论 0

血之狂魔

文章 0 评论 0

qq_0bIjwE

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文