文本语义分析
您建议使用哪些工具来进行文本语义分析?
这是我的问题:我有一个单词语料库(关键字、标签)。
我需要处理用户输入的句子,并查找它们在语义上是否与我拥有的语料库中的单词接近。
非常欢迎任何类型的建议(书籍或实际的工具包/API)。
问候,
Which tools would you recommend to look into for semantic analysis of text?
Here is my problem: I have a corpus of words (keywords, tags).
I need to process sentences, input by users and find if they are semantically close to words in the corpus that I have.
Any kind of suggestions (books or actual toolkits / APIs) are very welcome.
Regards,
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
一些有用的链接:
工具/库:
Some useful links to begin with:
Tools/Libraries:
如果您将语料库视为本体,Apache Stanbol - http://incubator.apache.org/stanbol/ - 可能有用。它在分析文本时使用 dbpedia 作为默认本体。尽管它还在孵化中,但增强器组件对于采用来说已经足够好了。所以,你可以尝试一下。
If you consider your corpus as an ontology, Apache Stanbol - http://incubator.apache.org/stanbol/ - might be useful. It uses dbpedia as the default ontology while analyzing text. Although it is incubating, enhancer component is good enough foe adoption. So, you can give it a try.
您可以尝试一些 WordNet 相似性测量。 Ted Pedersen 在 WordNet::Similarity 中汇总了这些指标,您可以进行试验和研究。其他语言(例如Java)也有对应的实现。
You can try some WordNet similarity measurements. Ted Pedersen has a compilation of those metrics in WordNet::Similarity which you can experiment and look into. There are counterpart implementations in other languages (e.g. Java).