Lucene 中字级注释层的索引和搜索
我有一个数据集,在底层文本上有多层注释,例如 part-of-标签,来自浅层解析器的块,名称实体,以及来自各种 自然语言处理 (NLP) 工具。对于像 The ma…
带有音节重音信息的英语单词语料库/数据集?
我知道这是一个不太可能的事情,但是有人知道有按音节重音信息的英语单词数据集吗?像下面这样简单的事情会很棒: AARD vark A ble a BOUT ac COUNT A…
如何在 WinForm 应用程序中尊重/继承用户的语言设置?
我过去曾使用过全球化设置,但没有在 .NET 环境中使用过,这是本问题的主题。我所看到的肯定是由于我尚未学习的知识所致,因此我希望对以下内容有所了…
Java文本分类问题
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…
Java 或 Python 分布式计算作业(根据学生预算)?
我有一个大型数据集(约 40G),我想在实验室中的几台计算机上使用它进行一些 NLP(基本上是令人尴尬的并行),但我没有 root 访问权限,并且只有1G用…
使用 PHP 进行文本挖掘
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
使用“天然”的产品是否更好?语言来写代码?
我最近看到一种名为 supernova 的编程语言,他们在网页中说: Supernova 编程语言是 现代脚本语言和 第一个提出的概念 用直接虚构进行编程 使用 进行…