tokenize

tokenize

文章 0 浏览 4

何时使用 NSScanner 与 ComponentsSeparatedByCharactersInSet: 来标记 NSString?

我需要在 iPhone 上标记许多字符串。显然,资源是最少的。我一直在使用 componentsSeparatedByCharactersInSet: 来标记我的字符串,但速度很慢。使用 …

风月客 2024-10-19 17:07:10 3 0

将句子放入列表中 - python

我知道 nltk 可以分割句子并使用以下代码将其打印出来。 但是我如何将句子放入列表中而不是输出到屏幕上? import nltk.data from nltk.tokenize impo…

ら栖息 2024-10-19 15:01:56 4 0

双向文本解析建议

我正在研究实现双向文本解析框架的可行性,以允许使用 Markdown、BBCode、DocuWiki 等常见范例的组合来处理格式化文本。实际上,这意味着每个实现都必…

始于初秋 2024-10-19 12:34:05 7 0

如何循环多个文件,保留基本名称以供进一步处理?

我有多个需要标记化的文本文件,POS 和 NER。我正在使用 C&C 标记器并运行了他们的教程,但我我想知道是否有一种方法可以标记多个文件而不是一个一个…

月棠 2024-10-19 11:39:44 10 0

Web 服务器 - 如何解析请求?异步流分词器?

我正在尝试以异步套接字编程风格在 C# 中创建一个简单的网络服务器。目的非常狭窄 - Comet 服务器(http 长轮询)。 我已经运行了 Windows 服务,接受…

多谢你的绝情让我学会死心 2024-10-19 05:25:11 2 0

生成 PHP 代码(从解析器令牌)

是否有任何可用的解决方案用于从 解析器令牌(重新)生成 PHP 代码由 token_get_all 返回?也欢迎其他用于生成 PHP 代码的解决方案,最好带有相关的词…

亽野灬性zι浪 2024-10-18 13:28:00 7 0

solr 用于查询的多个分词器

我对 SolR 还很陌生。我想使用多个标记器。 我正在使用标准分词器,以便通过 \t、空格、逗号等分割单词。 现在我想使用额外的分词器。 如果有 “cowsh…

鞋纸虽美,但不合脚ㄋ〞 2024-10-17 09:13:51 8 0

引用向量

我有这段代码 void split(vector &fvec, string str) { int place = 0; for(int i=0; i

小女人ら 2024-10-16 08:51:14 5 0

Objective-C 中的 HTTP 消息流标记化

我有一个 NSData 对象,它由多个连接在一起的 HTTP 响应或请求组成。将请求/响应流标记为单个 CFHTTPMessageRef 对象的最有效方法是什么? 我当前的方…

∝单色的世界 2024-10-14 01:53:06 8 0

从字符串中标记/提取信息的最佳方法

我正在尝试将收到的日期时间转换为特定格式以插入到 MySQL 数据库中。该程序是用 C++ 编写的,下面的解决方案可以工作,但我觉得它的效率非常低。 输…

捎一片雪花 2024-10-13 02:36:01 4 0

python tokenize 中的错误?

为什么这个 if 1 \ and 0: pass 最简单的代码会在 tokenize/untokenize 循环中阻塞 import tokenize import cStringIO def tok_untok(src): f = cStri…

滥情哥ㄟ 2024-10-12 18:12:09 2 0

Apache Commons lang StrTokenizer

由于我需要空标记来读取空字符串或 null,因此我决定使用 apache commons lang StrTokenizer 但我仍然无法得到空字符串。我知道我需要在标记化之前设…

不醒的梦 2024-10-11 23:42:41 4 0

Solr 中的索引和查询 URL

我有一个我想要搜索的 URL 数据库。因为 URL 并不总是写成相同的(可能有也可能没有 www),所以我正在寻找索引和查询 url 的正确方法。 我已经尝试了…

暮光沉寂 2024-10-11 21:27:46 7 0

如何使用 NGramTokenizerFactory 或 NGramFilterFactory?

最近在研究如何使用Solr进行存储和索引。我想做facet.prefix 搜索。使用空格标记器,“你在哪里”将被分成三个单词并建立索引。如果我搜索facet.prefi…

情独悲 2024-10-11 10:45:59 7 0

使用来自loopj.com的jQuery tokeninput

我可以选择从 .jsp 文件以 JSON 格式发送的多个选项。但是,当我想提交/访问文本输入元素“tokenize”中的值时,我得到未定义的输出。我是java脚本的…

腹黑女流氓 2024-10-10 12:42:20 4 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文