使用 R 进行文本检索
我一直在使用 R 的文本挖掘包,它确实是一个很棒的工具。我还没有找到检索支持,或者可能缺少一些功能。 如何使用R的文本挖掘包实现一个简单的VSM模型?
I have been using R's text mining package and its really a great tool. I have not found retrieval support or maybe there are functionalities I am missing.
How can a simple VSM model be implemented using the R's text mining package?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
假设 VSM = 向量空间模型,您可以通过以下方式建立一个简单的检索系统:
一种非 R 方法是在 PostgreSQL 中的表的文本列(行是文档)上使用 GINI 索引。使用 ts_vector 查询方法,您可以拥有一个非常快速的检索系统。
Assuming VSM = Vector Space Model, you can go about a simple retrieval system in the following manner:
A non-R method is to use the GINI index on a text column (rows are documents) of a table in PostgreSQL. Using the ts_vector querying methods, you can have a very fast retrieval system.