当前位置：文江博客话题详情

Sphinx MySQL full-text-search

Sphinx 搜索/MySQL 查找最常见的单词

发布于 2025-01-04 11:57:02 字数 120 浏览 7 评论 0原文

我有一个 sphinx 搜索索引，并且想查找索引中最常见的单词。理想情况下有一个按频率排序的单词列表。

如果无法使用 Sphinx 来做到这一点，有没有办法查询 mysql 表的文本字段以获得相同的统计数据？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

旧时模样 2025-01-11 11:57:02

是的。这很简单。使用 --buildstops 和 --buildfreqs 通过索引器构建它们
旗帜。

indexer --config /path/to/sphinx.conf  indexName --buildfreqs --buildstops freq_wordlist.txt 100000

此示例为您提供 sphinx 索引中的前 100000 个单词，按其频率排序

Yes. This is quite simple. Build them with indexer using the --buildstops and --buildfreqs
flags.

indexer --config /path/to/sphinx.conf  indexName --buildfreqs --buildstops freq_wordlist.txt 100000

This example gives you the first 100000 word in your sphinx index ordered by its frequency

回复收藏 0 原文

对风讲故事 2025-01-11 11:57:02

使用 --buildstops 和 --buildfreqs 标志通过索引器构建它们。

请注意，这不是从现有索引构建的，而是像索引一样针对数据源运行，并构建词频。它不会影响索引本身。

如果您使用增量索引来保存最后一个索引文档的 id，则这将读取最后保存的 id 并从那里开始工作。

回复收藏 0 原文

~没有更多了~

关于作者

爱本泡沫多脆弱

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文