MySQL 中如何提高插入数据的性能
对于一些数据量较大的系统,面临的问题除了是查询效率低下,还有一个很重要的问题就是插入时间长。我们就有一个业务系统,每天的数据导入需要 4-5 个钟。这种费时的操作其实是很有风险的,假设程序出了问题,想重跑操作那是一件痛苦的事情。因此提高大数据量系统的 MySQL 插入效率是很有必要的。
经过对 MySQL 的测试,发现一些可以提高插入效率的方法,供大家参考参考。
单条 SQL 语句插入多条数据
常用的插入语句如:
INSERT INTO`insert_table`
(`datetime`,`uid`,`content`,`type`)
VALUES
('0','userid_0','content_0',0);
INSERT INTO`insert_table`
(`datetime`,`uid`,`content`,`type`)
VALUES
('1','userid_1','content_1',1);
修改成:
INSERT INTO`insert_table`
(`datetime`,`uid`,`content`,`type`)
VALUES
('0','userid_0','content_0',0),
('1','userid_1','content_1',1);
修改后的插入操作能够提高程序的插入效率。这里第二种SQL执行效率高的主要原因有两个,一是减少 SQL 语句解析的操作, 只需要解析一次就能进行数据的插入操作,二是 SQL 语句较短,可以减少网络传输的 IO。
这里提供一些测试对比数据,分别是进行单条数据的导入与转化成一条SQL语句进行导入,分别测试1百、1千、1万条数据记录。
记录数 | 单条数据插入 | 多条数据插入 |
1百 | 0.149s | 0.011s |
1千 | 1.231s | 0.047s |
1万 | 11.678s | 0.218s |
在事物中进行插入处理
把插入修改成:
START TRANS ACTION;
INSERTINTO`insert_table`
(`datetime`,`uid`,`content`,`type`)
VALUES
('0','userid_0','content_0',0);
INSERT INTO`insert_table`
(`datetime`,`uid`,`content`,`type`)
VALUES
('1','userid_1','content_1',1);
...
COMMIT;
使用事物可以提高数据的插入效率,这是因为进行一个 INSERT 操作时,MySQL 内部会建立一个事物,在事物内进行真正插入处理。通过使用事物可以减少创建事物的消耗,所有插入都在执行后才进行提交操作。
这里也提供了测试对比,分别是不使用事物与使用事物在记录数为1百、1千、1万的情况。
记录数 | 不使用事物 | 使用事物 |
1百 | 0.149s | 0.033s |
1千 | 1.231s | 0.115s |
1万 | 11.678s | 1.050s |
性能测试
这里提供了同时使用上面两种方法进行 INSERT 效率优化的测试。即多条数据合并为同一个 SQL,并且在事物中进行插入。
记录数 | 单条数据插入 | 合并数据+事物插入 |
1万 | 0m15.977s | 0m0.309s |
10万 | 1m52.204s | 0m2.271s |
100万 | 18m31.317s | 0m23.332s |
从测试结果可以看到,INSERT 的效率大概有 50 倍的提高,这个一个很客观的数字。
注意事项
- SQL 语句是有长度限制,在进行数据合并在同一 SQL 中务必不能超过 SQL 长度限制,通过 max_allowed_packe 配置可以修改,默认是 1M。
- 事物需要控制大小,事物太大可能会影响执行的效率。MySQL 有 innodb_log_buffer_size 配置项,超过这个值会日志会使用磁盘数据,这时效率会有所下降。所以比较好的做法是,在事物大小达到配置项数据级前进行事物提交。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论