LINUX 上 MYSQL 优化三板斧

发布于 2024-11-28 13:10:31 字数 6101 浏览 37 评论 0

现在 MySQL 运行的大部分环境都是在 Linux 上的，如何在 Linux 操作系统上根据 MySQL 进行优化，我们这里给出一些通用简单的策略。这些方法都有助于改进 MySQL 的性能。闲话少说，进入正题。

一、CPU

首先从 CPU 说起。

你仔细检查的话，有些服务器上会有的一个有趣的现象：你 cat /proc/cpuinfo 时，会发现 CPU 的频率竟然跟它标称的频率不一样：

#cat /proc/cpuinfo 
processor : 5
model name : Intel(R) Xeon(R) CPU E5-2620 0 @2.00GHz
 ...
cpu MHz : 1200.000

这个是 Intel E5-2620 的 CPU，他是 2.00G * 24 的 CPU，但是，我们发现第 5 颗 CPU 的频率为 1.2G。

这是什么原因呢？

这些其实都源于 CPU 最新的技术：节能模式。操作系统和 CPU 硬件配合，系统不繁忙的时候，为了节约电能和降低温度，它会将 CPU 降频。这对环保人士和抵制地球变暖来说是一个福音，但是对 MySQL 来说，可能是一个灾难。

为了保证 MySQL 能够充分利用 CPU 的资源，建议设置 CPU 为最大性能模式。这个设置可以在 BIOS 和操作系统中设置，当然，在 BIOS 中设置该选项更好，更彻底。由于各种 BIOS 类型的区别，设置为 CPU 为最大性能模式千差万别，我们这里就不具体展示怎么设置了。

二、内存

然后我们看看内存方面，我们有哪些可以优化的。

i) 我们先看看 numa

非一致存储访问结构 (NUMA ： Non-Uniform Memory Access) 也是最新的内存管理技术。它和对称多处理器结构 (SMP ： Symmetric Multi-Processor) 是对应的。简单的队别如下：

如图所示，详细的 NUMA 信息我们这里不介绍了。但是我们可以直观的看到：SMP 访问内存的都是代价都是一样的；但是在 NUMA 架构下，本地内存的访问和非本地内存的访问代价是不一样的。对应的根据这个特性，操作系统上，我们可以设置进程的内存分配方式。目前支持的方式包括：

--interleave=nodes
--membind=nodes
--cpunodebind=nodes
--physcpubind=cpus
--localalloc
--preferred=node

简而言之，就是说，你可以指定内存在本地分配，在某几个 CPU 节点分配或者轮询分配。除非是设置为--interleave=nodes 轮询分配方式，即内存可以在任意 NUMA 节点上分配这种方式以外。其他的方式就算其他 NUMA 节点上还有内存剩余，Linux 也不会把剩余的内存分配给这个进程，而是采用 SWAP 的方式来获得内存。有经验的系统管理员或者 DBA 都知道 SWAP 导致的数据库性能下降有多么坑爹。

所以最简单的方法，还是关闭掉这个特性。

关闭特性的方法，分别有：可以从 BIOS，操作系统，启动进程时临时关闭这个特性。

a) 由于各种 BIOS 类型的区别，如何关闭 NUMA 千差万别，我们这里就不具体展示怎么设置了。

b) 在操作系统中关闭，可以直接在/etc/grub.conf 的 kernel 行最后添加 numa=off，如下所示：

kernel /vmlinuz-2.6.32-220.el6.x86_64 ro root=/dev/mapper/VolGroup-root 
 rd_NO_LUKS LANG=en_US.UTF-8 rd_LVM_LV=VolGroup/root rd_NO_MD quiet 
 SYSFONT=latarcyrheb-sun16 rhgb crashkernel=auto rd_LVM_LV=VolGroup/swap
 rhgb crashkernel=auto quiet KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM numa=off

另外可以设置 vm.zone_reclaim_mode=0 尽量回收内存。

c) 启动 MySQL 的时候，关闭 NUMA 特性：

numactl --interleave=all  mysqld &

当然，最好的方式是在 BIOS 中关闭。

ii) 我们再看看 vm.swappiness。

vm.swappiness 是操作系统控制物理内存交换出去的策略。它允许的值是一个百分比的值，最小为 0，最大运行 100，该值默认为 60。vm.swappiness 设置为 0 表示尽量少 swap，100 表示尽量将 inactive 的内存页交换出去。

具体的说：当内存基本用满的时候，系统会根据这个参数来判断是把内存中很少用到的 inactive 内存交换出去，还是释放数据的 cache。cache 中缓存着从磁盘读出来的数据，根据程序的局部性原理，这些数据有可能在接下来又要被读取；inactive 内存顾名思义，就是那些被应用程序映射着，但是“长时间”不用的内存。

我们可以利用 vmstat 看到 inactive 的内存的数量：

#vmstat -an 1 
 procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu----- 
 r b swpd free  inact  active si so bi bo in cs us sy id wa st 
 1 0 0 27522384 326928 1704644 0 0 0 153 11 10 0 0 100 0 0 
 0 0 0 27523300 326936 1704164 0 0 0 74 784 590 0 0 100 0 0 
 0 0 0 27523656 326936 1704692 0 0 8 8 439 1686 0 0 100 0 0 
 0 0 0 27524300 326916 1703412 0 0 4 52 198 262 0 0 100 0 0

通过/proc/meminfo 你可以看到更详细的信息：

#cat /proc/meminfo | grep -i inact 
 Inactive: 326972 kB 
 Inactive(anon): 248 kB 
 Inactive(file): 326724 kB

这里我们对不活跃 inactive 内存进一步深入讨论。 Linux 中，内存可能处于三种状态：free，active 和 inactive。众所周知，Linux Kernel 在内部维护了很多 LRU 列表用来管理内存，比如 LRU_INACTIVE_ANON, LRU_ACTIVE_ANON, LRU_INACTIVE_FILE , LRU_ACTIVE_FILE, LRU_UNEVICTABLE。其中 LRU_INACTIVE_ANON, LRU_ACTIVE_ANON 用来管理匿名页，LRU_INACTIVE_FILE , LRU_ACTIVE_FILE 用来管理 page caches 页缓存。系统内核会根据内存页的访问情况，不定时的将活跃 active 内存被移到 inactive 列表中，这些 inactive 的内存可以被交换到 swap 中去。

一般来说，MySQL，特别是 InnoDB 管理内存缓存，它占用的内存比较多，不经常访问的内存也会不少，这些内存如果被 Linux 错误的交换出去了，将浪费很多 CPU 和 IO 资源。 InnoDB 自己管理缓存，cache 的文件数据来说占用了内存，对 InnoDB 几乎没有任何好处。

所以，我们在 MySQL 的服务器上最好设置 vm.swappiness=0。

我们可以通过在 sysctl.conf 中添加一行：

echo "vm.swappiness = 0" >>/etc/sysctl.conf

并使用 sysctl -p 来使得该参数生效。

三、文件系统

最后，我们看一下文件系统的优化

i) 我们建议在文件系统的 mount 参数上加上 noatime，nobarrier 两个选项。

用 noatime mount 的话，文件系统在程序访问对应的文件或者文件夹时，不会更新对应的 access time。一般来说，Linux 会给文件记录了三个时间，change time, modify time 和 access time。

我们可以通过 stat 来查看文件的三个时间：

stat libnids-1.16.tar.gz 
 File: `libnids-1.16.tar.gz' 
 Size: 72309 Blocks: 152 IO Block: 4096 regular file 
 Device: 302h/770d Inode: 4113144 Links: 1 
 Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root) 
  Access  : 2008-05-27 15:13:03.000000000 +0800 
 Modify: 2004-03-10 12:25:09.000000000 +0800 
 Change: 2008-05-27 14:18:18.000000000 +0800

其中 access time 指文件最后一次被读取的时间，modify time 指的是文件的文本内容最后发生变化的时间，change time 指的是文件的 inode 最后发生变化（比如位置、用户属性、组属性等) 的时间。一般来说，文件都是读多写少，而且我们也很少关心某一个文件最近什么时间被访问了。

所以，我们建议采用 noatime 选项，这样文件系统不记录 access time，避免浪费资源。

现在的很多文件系统会在数据提交时强制底层设备刷新 cache，避免数据丢失，称之为 write barriers。但是，其实我们数据库服务器底层存储设备要么采用 RAID 卡，RAID 卡本身的电池可以掉电保护；要么采用 Flash 卡，它也有自我保护机制，保证数据不会丢失。所以我们可以安全的使用 nobarrier 挂载文件系统。设置方法如下：

对于 ext3, ext4 和 reiserfs 文件系统可以在 mount 时指定 barrier=0；对于 xfs 可以指定 nobarrier 选项。

ii) 文件系统上还有一个提高 IO 的优化万能钥匙，那就是 deadline。

在 Flash 技术之前，我们都是使用机械磁盘存储数据的，机械磁盘的寻道时间是影响它速度的最重要因素，直接导致它的每秒可做的 IO(IOPS) 非常有限，为了尽量排序和合并多个请求，以达到一次寻道能够满足多次 IO 请求的目的，Linux 文件系统设计了多种 IO 调度策略，已适用各种场景和存储设备。

Linux 的 IO 调度策略包括：Deadline scheduler，Anticipatory scheduler，Completely Fair Queuing(CFQ)，NOOP。每种调度策略的详细调度方式我们这里不详细描述，这里我们主要介绍 CFQ 和 Deadline，CFQ 是 Linux 内核 2.6.18 之后的默认调度策略，它声称对每一个 IO 请求都是公平的，这种调度策略对大部分应用都是适用的。

但是如果数据库有两个请求，一个请求 3 次 IO，一个请求 10000 次 IO，由于绝对公平，3 次 IO 的这个请求都需要跟其他 10000 个 IO 请求竞争，可能要等待上千个 IO 完成才能返回，导致它的响应时间非常慢。并且如果在处理的过程中，又有很多 IO 请求陆续发送过来，部分 IO 请求甚至可能一直无法得到调度被“饿死”。而 deadline 兼顾到一个请求不会在队列中等待太久导致饿死，对数据库这种应用来说更加适用。

实时设置，我们可以通过

echo deadline >/sys/block/sda/queue/scheduler

来将 sda 的调度策略设置为 deadline。我们也可以直接在/etc/grub.conf 的 kernel 行最后添加 elevator=deadline 来永久生效。

总结

CPU 方面：关闭电源保护模式
内存：vm.swappiness = 0
关闭 numa
文件系统：用 noatime，nobarrier 挂载系统
IO 调度策略修改为 deadline。

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

关于作者

撑一把青伞

暂无简介

文章

29 人气

关注发私信

友情链接

文江博客

LINUX 上 MYSQL 优化三板斧

一、CPU

二、内存

i) 我们先看看 numa

ii) 我们再看看 vm.swappiness。

三、文件系统

i) 我们建议在文件系统的 mount 参数上加上 noatime，nobarrier 两个选项。

ii) 文件系统上还有一个提高 IO 的优化万能钥匙，那就是 deadline。

总结

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

你可能也喜欢

在 WordPress 中添加画册 Gallery Shortcode

JavaScript 将其他数据类型转换为字符串

Dancer.js 高品质音频 JavaScript API 插件

JavaScript 数组元素的排序及洗牌算法

BindingX 阿里巴巴开源基于 weex / React Native 的富交互解决方案

Validform 一行代码搞定整站的表单验证

SQL 多表连接 join 查询详细介绍

网站优化之中文文案排版指北

发布评论

关于作者

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

LINUX 上 MYSQL 优化三板斧

一、CPU

二、内存

i) 我们先看看 numa

ii) 我们再看看 vm.swappiness。

三、文件系统

i) 我们建议在文件系统的 mount 参数上加上 noatime，nobarrier 两个选项。

ii) 文件系统上还有一个提高 IO 的优化万能钥匙，那就是 deadline。

总结

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

你可能也喜欢

发布评论

关于作者

热门标签

推荐作者

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。