当前位置：文江博客话题详情

在MYSQL中通过一个varchar列快速排序10亿行

发布于 2024-11-14 03:12:57 字数 92 浏览 6 评论 0原文

我在 MYSQL 中存储了 10 亿行，我需要通过 varchar 列按字母顺序输出它们，最有效的方法是什么。允许使用其他 Linux 实用程序，例如 sort awk。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

嘿看小鸭子会跑 2024-11-21 03:12:57

MySQL 可以处理十亿行。效率取决于 3 个主要因素：缓冲区、索引和连接。

一些建议：

尝试将您正在使用的数据集放入内存中

内存中的处理速度要快得多，这样做就解决了一大堆问题。使用多个服务器来托管部分数据集。将您要使用的部分数据存储在临时表等中。

优先选择全表扫描而不是索引访问

对于大型数据集，全表扫描通常比范围扫描和其他类型的索引查找更快。即使您查看 1% 或更少的行，全表扫描可能会更快。

避免连接到大型表

使用嵌套循环连接大型数据集的成本非常高。尽量避免它。连接到较小的表是可以的，但您可能希望在连接之前将它们预加载到内存中，这样就不需要随机 IO 来填充缓存。

请注意 MySQL 的限制，这要求您在处理大型数据集时要格外小心。在 MySQL 中，查询作为单个线程运行（MySQL Cluster 除外），MySQL 会一一发出 IO 请求来执行查询，这意味着如果您关心单个查询执行时间，那么许多硬盘和大量 CPU 将无济于事。

有时，手动将查询拆分为多个、并行运行并聚合结果集是个好主意。

您没有提供有关您的设置或数据集的太多信息，但这应该为您提供一些需要注意的线索。在我看来，让（适当调整的）数据库为您进行排序会比以编程方式进行排序更快，除非您有帖子中未提及的非常具体的需求。

回复收藏 0 原文

暮倦 2024-11-21 03:12:57

您是否刚刚尝试过对列建立索引并将其转储出来？在进入异国情调之前，我会先尝试看看性能是否不足。

回复收藏 0 原文

忘羡 2024-11-21 03:12:57

这取决于你如何定义高效。 CPU/内存/IO/时间/编码工作量。在这种情况下什么是重要的？

“select * from big_table order by the_varchar_column” 这可能是对开发人员资源最有效的利用。添加索引可能会使其运行速度更快。

回复收藏 0 原文

~没有更多了~

关于作者

陌伤ぢ

暂无简介

文章

26 人气

关注发私信

牛↙奶布丁

文章 0 评论 0

关注

COSO

文章 0 评论 0

关注

落叶

文章 0 评论 0

关注

暗地喜欢

文章 0 评论 0

关注

qq_i8qOEG

文章 0 评论 0

关注

qq_Wl4Sbi

文章 0 评论 0

友情链接

文江博客

在MYSQL中通过一个varchar列快速排序10亿行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签