当前位置：文江博客话题详情

数据库与平面文件，这是“正则表达式”的更快结构。与许多同时请求匹配

发布于 2024-09-02 17:01:06 字数 347 浏览 4 评论 0原文

哪种结构返回更快的结果和/或减少主机服务器、平面文件或数据库（mysql）的负担？

假设许多用户（100 个用户）同时查询文件/db。搜索涉及针对静态文件/数据库的模式匹配。文件有 50,000 个唯一行（相同数据类型）。可能会有很多场比赛。没有写入文件/db，只是读取。

如果主文件正在使用中，是否可以复制文件/数据库并编写逻辑开关以使用备份文件/数据库？

哪种语言最适合这种结构类型？ Perl 用于平面，PHP 用于数据库？

附加信息：

如果我想找到所有名称中都有“cis”模式的城市。使用正则表达式或字符串函数哪个更好/更快？

请推荐一个

TIA策略

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

捂风挽笑 2024-09-09 17:01:06

我非常喜欢简单的解决方案，因此对于简单的任务，我更喜欢平面文件存储。具有索引功能的关系数据库根本无法帮助您处理任意正则表达式模式，并且文件系统的缓存可确保这个相当小的文件无论如何都在内存中。我会走平面文件 + perl 路线。

编辑：（考虑到您的新信息）如果它实际上只是在一个已知属性中查找子字符串，那么使用全文索引（数据库提供的）会对您有所帮助（取决于应用的索引类型），并且可能提供适合您要求的简单且相当快速的解决方案。当然，您可以自己在文件系统上实现索引，例如使用后缀树，速度方面很难被击败。

尽管如此，我还是会采用平面文件路线（如果它符合您的目的，请看看awk），因为如果您已经开始实现它，您就已经完成了；）此外我怀疑你所说的用户数量不会让系统感觉到差异（无论如何你的CPU大多数时候都会感到无聊）。

如果你不确定，就试试吧！实现 regex+perl 解决方案，如果您了解 perl，则需要几分钟，循环 100 次并用 时间 进行测量。如果它足够快，请使用它，如果不够快，请考虑其他解决方案。您必须记住，就现代计算而言，50,000 条独特的行确实是一个很小的数字。（与此比较：优化子字符串查询的 Mysql 表索引）

HTH ,
亚历山大