从文本中提取名词+名词或(形容词|名词)+名词
是否可以使用 R 包 openNLP 提取 noun+noun 或 (adj|noun)+noun?也就是说,我想使用语言过滤来提取候选名词短语。你能指导我该怎么做吗? 非常感谢。…
如何使用 NLP 技术筛选成语并将短语与其他常见短语区分开来?
存在什么技术可以区分简单的常见短语(例如“to the”、“and the”)和具有自己词汇含义的固定短语和习语(例如“pick up”、“fall in love”、“红…
在哪里可以找到德语的带有性别和复数的单词表?
Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…
OpenNLP 的德国 maxent 模型使用什么标签集?
目前,我正在使用 OpenNLP 工具对德语句子进行 PoS 标记,其 下载站点 上列出了 maxent 模型: de POS Tagger Maxent model trained on tiger corpus.…
使用 Perl Regex 解析语法树
也许正则表达式不是解析这个的最佳方法,请告诉我是否不是。无论如何,这里有一些语法树的例子: (S (CC and)) (SBARTMP (IN once) (NP otherstuff)) …
拉丁字母到英文字母哈希
我必须将所有拉丁字符转换为相应的英文字母。我可以使用 Python 来做吗?或者有没有可用的映射? 非 Unicode 字符 Ramírez Sánchez 的 Unicode 值应转…
有哪些类似于 OpenCalais 或 AlchemyAPI 的商用平台可用于中文和日文的实体提取?
特别是,我希望能够提取人物、地点、电影、音乐等实体,并在广泛使用的链接数据 ID(例如 DBpedia、Freebase 或 OpenCyc)中提供这些实体。…
使用马尔可夫模型将全大写转换为混合大小写及相关问题
我一直在考虑使用马尔可夫技术来恢复自然语言文本中丢失的信息。 将全部大写文本恢复为大小写混合。 将重音符号/变音符号恢复为应有但已转换为纯 ASCI…