多语言数据的特征选择和无监督学习机器学习算法选择
Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题?通过编辑这篇文章来更新问题,使其仅…
从给定文本中提取英语动词
Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…
使用 NLTK 对 POS 标记词进行词形还原?
我用 nltk.pos_tag() 标记了一些单词,因此它们被赋予了树库标签。我想使用已知的 POS 标签对这些单词进行词形还原,但我不知道如何做。我正在查看 Wo…
用于句子相似度检测的 BLEU 评分实现
我需要计算 BLEU 分数来识别两个句子是否相似。我读过一些文章,其中大部分是关于用于测量机器翻译准确性的 BLEU 分数。但是我需要 BLEU 分数来找出句…
有人可以解释一下这个 mgiza 脚本是如何工作的吗?
$:~/mgizapp/scripts$ ./plain2snt-hasvcb.py Error, the input should be ./plain2snt-hasvcb.py evcb fvcb etxt ftxt esnt(out) fsnt(out) evcbx(ou…
在 bash ubuntu 上运行 WINE
有谁知道如何在 ubuntu bash 脚本上在 WINE 上运行 windows .exe?在 ubuntu 10.10 上运行, 这是我尝试从 http://isoft.postech.ac.kr/Course/CS730b…
在Python中读取#char
有人可以帮我在 python 中读取“#”字符吗?我似乎无法获取该文件。因为这是 stanford postagger 的输出,是否有任何脚本可用于转换 stanford postagg…
如何计算 POS 标注器的标签精度和召回率?
我正在使用一些基于规则和统计的 POS 标记器来使用词性 (POS) 标记语料库(大约 5000 个句子)。以下是我的测试语料库的一个片段,其中每个单词都由其…
stanford 解析 bash 脚本错误 - linux bash
有人可以帮我检查我的 bash 脚本吗?我正在尝试将 .txt 文件的目录提供给斯坦福解析器(http://nlp.stanford.edu/software/pos-tagger-faq.shtml),…