除了 NLTK 之外,Python 最好的信息检索库是什么?
用于分析互联网上的文档!
For use to analyze documents on the Internet!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
用于分析互联网上的文档!
For use to analyze documents on the Internet!
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(2)
或者,R 有许多可用于文本挖掘的工具,并且很容易使用 RPy2 与 Python 集成。
查看CRAN 上的自然语言处理视图。特别是查看
tm
包。以下是一些相关链接:邮件列表 (https://stat.ethz.ch/pipermail/r-devel/) 2006 年以来的新闻组帖子。
此外,R 还提供了许多用于解析 HTML 或XML。 看看这个问题的示例,使用
RCurl
和XML
包。Alternatively, R has many tools available for text mining, and it's easy to integrate with Python using RPy2.
Have a look at the Natural Language Processing view on CRAN. In particular, look at the
tm
package. Here are some relevant links:mailing list (https://stat.ethz.ch/pipermail/r-devel/) newsgroup postings from 2006.
In addition, R provides many tools for parsing HTML or XML. Have a look at this question for an example using the
RCurl
andXML
packages.您能否提供更多信息,说明为什么 NLTK 不足,或者您需要哪些功能才能将某个框架视为“最佳”?
尽管如此,还是有内置的 shlex 词法解析库。
最近还有一本关于该主题的书,使用 Python 进行自然语言处理。看起来至少有一部分涵盖了 NLTK。
您可能还想查看 awaretek 网站上的教程和库列表,它还指向 NLQ.py 框架。
使用 Python 进行自然语言处理 http://ecx.images-amazon.com /images/I/41NBqj7NyGL._BO2.jpg
Could you please provide more information why NLTK is insufficient or what features you need to consider some framework the "best"?
Nevertheless, there is the builtin shlex lexical parsing library.
There is also a recent book on the subject, Natural Language Processing with Python. It looks like at least part of it covers NLTK.
You might also want to look at this list of tutorials and libraries on the awaretek website, which also points to the NLQ.py framework.
Natural Language Processing with Python http://ecx.images-amazon.com/images/I/41NBqj7NyGL._BO2.jpg