第 10 页 - tokenize - 文江博客

投稿关注

tokenize

文章 0 浏览 6

将句子放入列表中 - python

我知道 nltk 可以分割句子并使用以下代码将其打印出来。但是我如何将句子放入列表中而不是输出到屏幕上？ import nltk.data from nltk.tokenize impo…

ら栖息 2024-10-19 15:01:56 6 0

双向文本解析建议

我正在研究实现双向文本解析框架的可行性，以允许使用 Markdown、BBCode、DocuWiki 等常见范例的组合来处理格式化文本。实际上，这意味着每个实现都必…

始于初秋 2024-10-19 12:34:05 9 0

如何循环多个文件，保留基本名称以供进一步处理？

我有多个需要标记化的文本文件，POS 和 NER。我正在使用 C&C 标记器并运行了他们的教程，但我我想知道是否有一种方法可以标记多个文件而不是一个一个…

月棠 2024-10-19 11:39:44 14 0

Web 服务器 - 如何解析请求？异步流分词器？

我正在尝试以异步套接字编程风格在 C# 中创建一个简单的网络服务器。目的非常狭窄 - Comet 服务器（http 长轮询）。我已经运行了 Windows 服务，接受…

多谢你的绝情让我学会死心 2024-10-19 05:25:11 4 0

生成 PHP 代码（从解析器令牌）

是否有任何可用的解决方案用于从解析器令牌（重新）生成 PHP 代码由 token_get_all 返回？也欢迎其他用于生成 PHP 代码的解决方案，最好带有相关的词…

亽野灬性zι浪 2024-10-18 13:28:00 8 0

solr 用于查询的多个分词器

我对 SolR 还很陌生。我想使用多个标记器。我正在使用标准分词器，以便通过 \t、空格、逗号等分割单词。现在我想使用额外的分词器。如果有 “cowsh…

鞋纸虽美，但不合脚ㄋ〞 2024-10-17 09:13:51 11 0

引用向量

我有这段代码 void split(vector &fvec, string str) { int place = 0; for(int i=0; i

小女人ら 2024-10-16 08:51:14 6 0

Objective-C 中的 HTTP 消息流标记化

我有一个 NSData 对象，它由多个连接在一起的 HTTP 响应或请求组成。将请求/响应流标记为单个 CFHTTPMessageRef 对象的最有效方法是什么？我当前的方…

∝单色的世界 2024-10-14 01:53:06 12 0

从字符串中标记/提取信息的最佳方法

我正在尝试将收到的日期时间转换为特定格式以插入到 MySQL 数据库中。该程序是用 C++ 编写的，下面的解决方案可以工作，但我觉得它的效率非常低。输…

捎一片雪花 2024-10-13 02:36:01 6 0

python tokenize 中的错误？

为什么这个 if 1 \ and 0: pass 最简单的代码会在 tokenize/untokenize 循环中阻塞 import tokenize import cStringIO def tok_untok(src): f = cStri…

滥情哥ㄟ 2024-10-12 18:12:09 3 0

Apache Commons lang StrTokenizer

由于我需要空标记来读取空字符串或 null，因此我决定使用 apache commons lang StrTokenizer 但我仍然无法得到空字符串。我知道我需要在标记化之前设…

不醒的梦 2024-10-11 23:42:41 6 0

Solr 中的索引和查询 URL

我有一个我想要搜索的 URL 数据库。因为 URL 并不总是写成相同的（可能有也可能没有 www），所以我正在寻找索引和查询 url 的正确方法。我已经尝试了…

暮光沉寂 2024-10-11 21:27:46 11 0

如何使用 NGramTokenizerFactory 或 NGramFilterFactory？

最近在研究如何使用Solr进行存储和索引。我想做facet.prefix 搜索。使用空格标记器，“你在哪里”将被分成三个单词并建立索引。如果我搜索facet.prefi…

情独悲 2024-10-11 10:45:59 8 0

使用来自loopj.com的jQuery tokeninput

我可以选择从 .jsp 文件以 JSON 格式发送的多个选项。但是，当我想提交/访问文本输入元素“tokenize”中的值时，我得到未定义的输出。我是java脚本的…

腹黑女流氓 2024-10-10 12:42:20 4 0

我想在 Jquery tokenInput 上插入令牌项

在 jQuery 插件：标记自动完成文本输入中，我们有： $("#tokenize").tokenInput("php-example.php?a=1&b=2", { hintText: "Type in the names of your…

戏舞 2024-10-10 11:53:33 7 0

共 19 页
上一页
8
9
10
11
12
下一页

关注

尘曦

文章 0 评论 0

关注

在梵高的星空下

文章 0 评论 0

关注

善良天后

文章 0 评论 0

关注

韬韬不绝

文章 0 评论 0

关注

qq_CgiN62

文章 0 评论 0

关注

不美如何

文章 0 评论 0

友情链接

文江博客

tokenize

将句子放入列表中 - python

双向文本解析建议

如何循环多个文件，保留基本名称以供进一步处理？

Web 服务器 - 如何解析请求？异步流分词器？

生成 PHP 代码（从解析器令牌）

solr 用于查询的多个分词器

引用向量

Objective-C 中的 HTTP 消息流标记化

从字符串中标记/提取信息的最佳方法

python tokenize 中的错误？

Apache Commons lang StrTokenizer

Solr 中的索引和查询 URL

如何使用 NGramTokenizerFactory 或 NGramFilterFactory？

使用来自loopj.com的jQuery tokeninput

我想在 Jquery tokenInput 上插入令牌项

热门标签

推荐作者

尘曦

在梵高的星空下

善良天后

韬韬不绝

qq_CgiN62

不美如何

友情链接