我应该如何加载 .txt 文件的内容以在网站上提供服务？

发布于 2025-01-04 00:40:20 字数 533 浏览 5 评论 0原文

我正在尝试为我的网站上作为搜索结果返回的每个文档构建摘录。我正在 Linux CentOS 上使用 Sphinx 搜索引擎和 Apache Web 服务器。我想使用的 Sphinx API 中的函数称为构建摘录。此函数要求您传递一个字符串数组，其中每个字符串包含文档内容。

我想知道当我在网络上提供结果时实时检索文档内容的最佳实践是什么。目前，这些文档位于我系统上的文本文件中，分布在多个驱动器上。它们大约有 100MM，占用几 TB 的空间。

对我来说，调用诸如 file_get_contents() 之类的东西很容易，但这感觉像是错误的方法。我的数据库已经很大（100GB+），我并不想将文档内容与已经存在的文档属性一起放入其中。然而，也许这是最好的方法。

建议？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

指尖凝香 2025-01-11 00:40:20

那么源需要从某个地方获取。如果您不想在数据库中复制它，那么您将需要从文件系统中获取它。（使用 file_get_contets 或类似的）

虽然 BuildExerpts 函数确实为您提供了一个额外的选项“load_files”

...然后 sphinx 将为您从文件名中读取数据。

从文件中读取它时遇到什么问题？是不是太慢了？如果是这样，也许在前面使用一些缓存 - 也许使用内存缓存。

回复收藏 0 原文

~没有更多了~

关于作者

策马西风

暂无简介

文章

697 人气

关注发私信

友情链接

文江博客

我应该如何加载 .txt 文件的内容以在网站上提供服务？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

我应该如何加载 .txt 文件的内容以在网站上提供服务？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

李珊平

Quxin

范无咎

github_ZOJ2N8YxBm

若言

南…巷孤猫

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。