Objective-C 中的文档聚类
我正在制作一个应用程序,根据每个文档的单词/短语内容将一组文档(数量从最少约 10 个文档到最多约 2000 个文档)组织成组。每个文档的范围可以从一段文字到大约一页半。
我不是在寻找一个基于初始搜索词对结果进行聚类的文档聚类库,而是一个在没有搜索词的情况下进行聚类的库。
是否有任何可以轻松与 Objective-C 项目集成的文档聚类库?
I am making an application that organizes a set of documents (ranging in number from a minimum of ~10 documents to a maximum of ~2000) into groups, based on the word/phrase content of each document. Each document can range from a paragraph of words to about a page and a half.
I'm not looking for a document clustering library that clusters results based on an initial search term, but a library that clusters without a search term.
Are there any libraries out there that do document clustering that can easily integrate with an Objective-C project?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我对 Object C 的了解不是很深入,但是如果您可以导入本机 C 代码,那么您可以使用 GreetyRSC 启发式。我们在路透社和洛杉矶时报语料库中获得了非常好的结果。
消息的描述& C 代码可在此处获取: http://research.nii.ac.jp /~meh/greedyRSC/rscpage.html
I'm not very well-read in Object C, but if you can import native C code then you could use the greedyRSC heuristic. We had very nice results for the Reuters and LA-Times corpora.
Description of the message & C-code is available here: http://research.nii.ac.jp/~meh/greedyRSC/rscpage.html