Objective-C 中的文档聚类

发布于 2024-10-17 04:08:25 字数 194 浏览 5 评论 0原文

我正在制作一个应用程序,根据每个文档的单词/短语内容将一组文档(数量从最少约 10 个文档到最多约 2000 个文档)组织成组。每个文档的范围可以从一段文字到大约一页半。

我不是在寻找一个基于初始搜索词对结果进行聚类的文档聚类库,而是一个在没有搜索词的情况下进行聚类的库。

是否有任何可以轻松与 Objective-C 项目集成的文档聚类库?

I am making an application that organizes a set of documents (ranging in number from a minimum of ~10 documents to a maximum of ~2000) into groups, based on the word/phrase content of each document. Each document can range from a paragraph of words to about a page and a half.

I'm not looking for a document clustering library that clusters results based on an initial search term, but a library that clusters without a search term.

Are there any libraries out there that do document clustering that can easily integrate with an Objective-C project?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

So要识趣 2024-10-24 04:08:25

我对 Object C 的了解不是很深入,但是如果您可以导入本机 C 代码,那么您可以使用 GreetyRSC 启发式。我们在路透社和洛杉矶时报语料库中获得了非常好的结果。

消息的描述& C 代码可在此处获取: http://research.nii.ac.jp /~meh/greedyRSC/rscpage.html

I'm not very well-read in Object C, but if you can import native C code then you could use the greedyRSC heuristic. We had very nice results for the Reuters and LA-Times corpora.

Description of the message & C-code is available here: http://research.nii.ac.jp/~meh/greedyRSC/rscpage.html

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文