狮身人面像东京暴君+ mysql
我正在考虑为我的一个项目创建一个全文搜索引擎。 我们有一个Mysql、Tokyo Tyrant和文件文档需要建立索引。
我现在正在查看 Sphinx,但我不知道是否可以使用它来索引每个文档。
我知道可以让 Sphinx 使用 Mysql,但我正在寻找一种方法让 Sphinx 索引和查询 Tokyo Tyrant 以及索引文件文档。
它可以是 Sphinx 或 Xapian 或其他的,但不是 JAVA(Lucene 已经退出),而是可以与 PHP 一起使用并在 Linux 上运行的东西。
有什么想法可以接受比 Mysql 更多的搜索引擎作为源吗?
谢谢
I'm looking at creating a full text search engine for one of my projects.
We have a Mysql, Tokyo Tyrant and file documents that need to be indexed.
I'm looking at Sphinx right now but I can't figured out if I can use it to index every document.
I know it's possible to let Sphinx to use Mysql but I'm looking at a way to let Sphinx index and query Tokyo Tyrant as well as index file documents.
It could be Sphinx or Xapian or another one but no JAVA (Lucene is out) but something that can be used with PHP and run on Linux.
Any idea of a search engine that can accept more that Mysql as the source?
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您可以使用 xmlpipe2 将数据从任何来源发送到 sphinx
您只需需要编写一些代码(可能是 PHP)来从 Tokyo Tyrant 读取(不知道那是什么,所以你只能自己在那里)和文件系统,并将其全部打包为 XML。然后,您只需设置 sphinx 源来运行执行自定义代码的命令,sphinx 就会处理其余的事情。
You can send data from any source to sphinx using the xmlpipe2
You'd just need to write some code (probably in PHP) to read from Tokyo Tyrant (not sure what that is so you're on your own there) and the filesystem and package it all up as XML. Then you just set up your sphinx source to run a command that executes your custom code and sphinx takes care of the rest.
如果您没有太多文档,并且只想使用 PHP,您应该查看
Zend_Search_Lucene
:不过,如果您使用自己的服务器,您可能可以安装软件,这意味着您可以部署 Sphinx 的 Lucence/SolR,即使它们不是仅用 PHP 编写的 - 如果您需要,这实际上可能是一个更安全的解决方案索引很多内容。
If you don't have too many documents, and want to use only PHP, you should take a look at
Zend_Search_Lucene
:Still, if you are using your own server, you can probably install software, which means you can deploy Lucence/SolR of Sphinx, even if they are not written in only-PHP -- this might actually be a safer solution if you need to index a lot of content.