0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一网打尽总结 Mysql的所有Buffer

jf_ro2CN3Fa 来源:芋道源码 2023-11-10 16:08 次阅读

今天填一下之前的坑,盘一盘 mysql 相关的 buffer。

我们来看一下官网的一张图:

a072fe4c-7f69-11ee-939d-92fbcf53809c.png

这张图画的是 mysql innodb 的架构,从图中可以看到有很多 buffer,这篇我们就一个一个盘过去。

发车!(文档基于mysql8.0,以下描述的存储引擎基于 mysql innodb)

buffer pool

首先,我们来看下 buffer pool。

其实 buffer pool 就是内存中的一块缓冲池,用来缓存表和索引的数据。

我们都知道 mysql 的数据最终是存储在磁盘上的,但是如果读存数据都直接跟磁盘打交道的话,这速度就有点慢了。

所以 innodb 自己维护了一个 buffer pool,在读取数据的时候,会把数据加载到缓冲池中,这样下次再获取就不需要从磁盘读了,直接访问内存中的 buffer pool 即可。

包括修改也是一样,直接修改内存中的数据,然后到一定时机才会将这些脏数据刷到磁盘上。

看到这肯定有小伙伴有疑惑:直接就在内存中修改数据,假设服务器突然宕机了,这个修改不就丢了?

别怕,有个 redolog 的存在,它会持久化这些修改,恢复时可以读取 redolog 来还原数据,这个我们后面的文章再详盘,今天的主角是 buffer 哈。

回到 buffer pool,其实缓冲池维护的是页数据,也就是说,即使你只想从磁盘中获取一条数据,但是 innodb 也会加载一页的数据到缓冲池中,一页默认是 16k。

当然,缓冲池的大小是有限的。按照 mysql 官网所说,在专用服务器上,通常会分配给缓冲池高达 80% 的物理内存,不管分配多少,反正内存大小正常来说肯定不会比磁盘大。

也就是说内存放不下全部的数据库数据,那说明缓冲池需要有淘汰机制,淘汰那些不常被访问的数据页。

按照这个需求,我们很容易想到 LRU 机制,最近最少使用的页面将被淘汰,即维护一个链表,被访问的页面移动到头部,新加的页面也加到头部,同时根据内存使用情况淘汰尾部的页面。

通过这样一个机制来维持内存且尽量让最近访问的数据留在内存中。

看起来这个想法不错,但 innodb 的实现并不是朴素的 LRU,而是一种变型的 LRU。

a084070a-7f69-11ee-939d-92fbcf53809c.png

从图中我们可以看出 buffer pool 分为了老年代(old sublist)和新生代(new sublist)。

老年代默认占 3/8,当然,可以通过 innodb_old_blocks_pct 参数来调整比例。

当有新页面加入 buffer pool 时,插入的位置是老年代的头部,同时新页面在 1s 内再次被访问的话,不会移到新生代,等 1s 后,如果该页面再次被访问才会被移动到新生代。

这和我们正常了解的 LRU 不太一样,正常了解的 LRU 实现是新页面插入到头部,且老页面只要被访问到就会被移动到头部,这样保证最近访问的数据都留存在头部,淘汰的只会是尾部的数据。

那为什么要实现这样改造的 LRU 呢?

innodb 有预读机制,简单理解就是读取连续的多个页面后,innodb 认为后面的数据也会被读取,于是异步将这些数据载入 buffer pool 中,但是这只是一个预判,也就是说预读的页面不一定会被访问。所以如果直接将新页面都加到新生代,可能会污染热点数据,但是如果新页面是加到老年代头部,就没有这个问题。

同时大量数据的访问,例如不带 where 条件的 select 或者 mysqldump 的操作等,都会导致同等数量的数据页被淘汰,如果简单加到新生代的话,可能会一次性把大量热点数据淘汰了,所以新页面加到老年代头部就没这个问题。

那 1s 机制是为了什么呢?

这个机制其实也是为了处理大量数据访问的情况,因为基本上大数据扫描之后,可能立马又再次访问,正常这时候需要把页移到新生代了,但等这波操作结束了,后面还有可能再也没有请求访问这些页面了,但因为这波扫描把热点数据都淘汰了,这就不太美丽了。

于是乎搞了个时间窗口,新页面在 1s 内的访问,并不会将其移到新生代,这样就不会淘汰热点数据了,然后 1s 后如果这个页面再次被访问,才会被移到新生代,这次访问大概率已经是别的业务请求,也说明这个数据确实可能是热点数据。

经过这两个改造, innodb 就解决了预读失效和一次性大批量数据访问的问题。

至此,对 buffer pool 的了解就差不多了。

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址:https://github.com/YunaiV/ruoyi-vue-pro

视频教程:https://doc.iocoder.cn/video/

change buffer

从上面的图我们可以看到, buffer pool 里面其实有一块内存是留给 change buffer 用的。

那 change buffer 是个啥玩意呢?

还记得我在 buffer pool 写的一句话吗:innodb 直接修改内存中的数据,然后到一定时机才会将这些脏数据刷到磁盘上。

也就是修改的时候直接修改的是 buffer pool 中的数据,但这个前提是 buffer pool 中已经存在你要修改的数据。

假设我们就直接执行一条 update table set name = 'yes' where id = 1,如果此时 buffer pool 里没有 id 为 1 的这条数据,那怎么办?

难道把这条数据先加载到 buffer pool 中,然后再执行修改吗?

当然不是,这时候 change buffer 就上场了。

如果当前数据页不在 buffer pool 中,那么 innodb 会把更新操作缓存到 change buffer 中,当下次访问到这条数据后,会把数据页加载到 buffer pool 中,并且应用上 change buffer 里面的变更,这样就保证了数据的一致性。

所以 change buffer 有什么好处?

当二级索引页不在 buffer pool 中时,change buffer 可以避免立即从磁盘读取对应索引页导致的昂贵的随机I/O ,对应的更改可以在后面当二级索引页读入 buffer pool 时候被批量应用。

看到我加粗的字体没,二级索引页,没错 change buffer 只能用于二级索引的更改,不适用于主键索引,空间索引以及全文索引。

还有,唯一索引也不行,因为唯一索引需要读取数据然后检查数据的一致性。

看到这肯定又有小伙伴关心:更改先缓存在 change buffer 中,假如数据库挂了,更改不是丢了吗?

别怕,change buffer 也是要落盘存储的,从上图我们看到 change buffer 会落盘到系统表空间里面,然后 redo log 也会记录 chang buffer 的修改来保证数据一致性。

至此,想必你对 change buffer 已经有一定了解了吧。

这玩意主要用来避免于二级索引页修改产生的随机I/O,如果你的内存够大能装下所有数据,或者二级索引很少,或者你的磁盘是固态的对随机访问影响不大,其实可以关闭 change buffer,这玩意也增加了复杂度,当然最终还是得看压测结果。

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址:https://github.com/YunaiV/yudao-cloud

视频教程:https://doc.iocoder.cn/video/

Log Buffer

接下来,我们看看 Log Buffer。

从上面的图我们可以得知,这玩意就是给 redo log 做缓冲用的。

redo log 我们都知道是重做日志,用来保证崩溃恢复数据的正确性,innodb 写数据时是先写日志,再写磁盘数据,即 WAL (Write-Ahead Logging),把数据的随机写入转换成日志的顺序写。

但,即使是顺序写 log ,每次都调用 write 或者 fsync 也是有开销的,毕竟也是系统调用,涉及上下文切换。

于是乎,搞了个 Log Buffer 来缓存 redo log 的写入。

即写 redo log 先写到 Log Buffer 中,等一定时机再写到 redo log 文件里。

我们每次事务可能涉及多个更改,这样就会产生多条 redo log,这时会都先写到 Log Buffer 中,等事务提交的时候,一起将这些 redo log 写到文件里。

或者当 Log Buffer 超过总量的一半(默认总量是 16mb),也会将数据刷到 redo log 文件中。

也有个后台线程,每隔 1s 就会将 Log Buffer 刷到 redo log 文件中。

从上面这些我们得知,Log Buffer 其实就是一个写优化操作,把多次 write 优化成一次 write,一次处理多数据,减少系统调用。

看到这肯定有小伙伴说,数据先写 Log Buffer 而不刷盘,这数据不会丢吗?

innodb 其实给了个配置,即 innodb_flush_log_at_trx_commit 来控制 redo log 写盘时机。

当值为 0,提交事务不会刷盘到 redo log,需要等每隔一秒的后台线程,将 log buffer 写到操作系统的 cache,并调用 fsync落盘,性能最好,但是可能会丢 1s 数据。

当值为 1,提交事务会将 log buffer 写到操作系统的 cache,并调用 fsync 落盘,保证数据正确,性能最差,这也是默认配置。

当值为 2,提交事务会将 log buffer 写到操作系统的 cache,但不调用 fsync,而是等每隔 1s 调用 fsync 落盘,性能折中,如果数据库挂了没事,如果服务器宕机了,会丢 1s 数据。

具体如何配置看你的业务了。

至此,想必你应该了解 Log Buffer 是干啥用了的吧。

Doublewrite Buffer

现在我们来看最后一个 buffer,即 Doublewrite Buffer。

这玩意又是啥用呢?

我们都知道 innodb 默认一页是 16K,而操作系统 Linux 内存页是 4K,那么一个 innodb 页对应 4 个系统页。

a09ab07c-7f69-11ee-939d-92fbcf53809c.png

所以 innodb 的一页数据要刷盘等于需要写四个系统页,那假设一页数据落盘的时候,只写了一个系统页 就断电了,那 innodb 一页数据就坏了,然后就 g 了,恢复不了。

a0b6c5c8-7f69-11ee-939d-92fbcf53809c.png

即产生了部分页面写问题,因为写 innodb 的一页无法保证原子性,所以引入了 Doublewrite Buffer。

其实就是当 innodb 要将数据落盘的时候,先将页数据拷贝到 Doublewrite Buffer 中,然后 Doublewrite Buffer 再刷盘到 Doublewrite Buffer Files,这时候数据已经落盘了。

然后再将数据页刷盘到本该到文件上。

从这个步骤我们得知,数据是写了两次磁盘,所以这玩意叫 double write。

之所以这样操作就是先找个地方暂存这次刷盘的完整数据,如果出现断电这种情况导致的部分页面写而损坏原先的完整页,可以从 Doublewrite Buffer Files 恢复数据。

但虽然是两次写,性能的话也不会低太多,因此数据拷贝到 Doublewrite Buffer 是内存拷贝操作,然后写到 Doublewrite Buffer Files 也是批量写,且是顺序写盘,所以整体而已,性能损失不会太多。

有了这玩意,在崩溃恢复的时候,如果发现页损坏,就可以从 Doublewrite Buffer Files 里面找到页副本,然后恢复即可。

完美。

最后

好了,关于 innodb buffer 们介绍完了,我们来总结一下:

buffer pool,缓存数据页,避免频繁地磁盘交互,内部利用定制的 LRU 来淘汰缓存页,LRU分老年代和新生代。

change buffer,用于二级非唯一索引的新增、修改或删除操作,当 buffer pool 没有数据的时候,不需要加载数据页到缓冲池中,而是通过 change buffer 来记录此变更,减少随机 I/O。

log buffer,用于 redo log 的缓冲,减少 I/O,批处理减少系统调用。

doublewrite Buffer,用于部分页面写问题,双写数据页,坏页时可从 doublewrite buffer files 进行页恢复,保证页的完整和数据的正确。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9072

    浏览量

    85280
  • buffer
    +关注

    关注

    2

    文章

    120

    浏览量

    30040
  • MySQL
    +关注

    关注

    1

    文章

    803

    浏览量

    26495

原文标题:一网打尽总结 Mysql 的所有 Buffer

文章出处:【微信号:芋道源码,微信公众号:芋道源码】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    解决在输出继电器的触点断开时CD4513的输入端悬空方法

    工程师必备网站PLC、DCS、仪器仪表、电气威廉希尔官方网站 资料,一网打尽
    的头像 发表于 09-20 09:53 1w次阅读

    一网打尽AUTOSAR MCAL模块

    MCAL:微控制器抽象层;位于BSW层中的最下层;
    的头像 发表于 01-25 16:30 1912次阅读
    <b class='flag-5'>一网打尽</b>AUTOSAR MCAL模块

    ARM经典300问

    `汇总了涉及ARM的300个问题,全面解析arm知识,arm学习疑点、难点一网打尽。`
    发表于 10-13 12:12

    最实用的LEDE驱动设计的18个经典案例

    原理、电路、方案、验证。从入门到精通、一网打尽
    发表于 06-29 22:25

    【下载有奖】Fluke红外热像资源中心,红外热像解读,一网打尽

    `Fluke红外热像资源中心,红外热像解读,一网打尽!做红外热像仪先锋者!红外大餐 • 典型应用篇更多精彩应用,请前往Fluke红外热像资源中心//www.obk20.com
    发表于 02-27 10:16

    搜狗输入法手机版免费下载(最新版)

    最新最全的手机词库和最准确的词频支持词频的自动调整,支持词库在线升级。所有类别的流行词汇这里一网打尽!流畅的按键流程设计,大大缩短您的手指移动距离到底该按
    发表于 10-17 16:04 0次下载

    PLC基础知识

    学习plc必备的基础知识一网打尽,精通了解了它,你就可以很轻松了
    发表于 07-05 16:49 9次下载

    【直通车】:PLC编程中的三大量知识点

    工控资料窝【www.gkwo.net】工程师必备网站 PLC、DCS、仪器仪表、电气威廉希尔官方网站 资料,一网打尽
    的头像 发表于 03-02 14:30 4321次阅读
    【直通车】:PLC编程中的三大量知识点

    现场总线知识合集 看到就是赚到了

    工控资料窝【www.gkwo.net】工程师必备网站 PLC、DCS、仪器仪表、电气威廉希尔官方网站 资料,一网打尽
    的头像 发表于 05-11 17:18 3804次阅读
    现场总线知识合集  看到就是赚到了

    设计师原理图设计中常见的错误总结

    在原理图设计过程中可能会产生100多个错误,您能在审查过程中全部发现吗?来看看如何把它们一网打尽吧。
    发表于 06-11 09:17 5070次阅读
    设计师原理图设计中常见的错误<b class='flag-5'>总结</b>

    关于在电气行业面试时的34个问题解答

    工控资料窝【www.gkwo.net】工程师必备网站PLC、DCS、仪器仪表、电气威廉希尔官方网站 资料,一网打尽
    的头像 发表于 10-05 09:12 3w次阅读

    电能质量标准中常用术语和定义的解读

    电能质量标准术语大揭秘,从PU到谐波源阻抗,一网打尽!电压暂降、谐波幅值,轻松搞定!
    的头像 发表于 01-15 11:44 594次阅读
    电能质量标准中常用术语和定义的解读

    SMT贴装的常见缺陷,AOI机器一网打尽

    SMT贴装的常见缺陷,AOI机器一网打尽
    的头像 发表于 03-01 10:49 917次阅读

    一网打尽十二款高端智能手表,兼顾功能与价格,总有款适合你!

    款既符合自己需求又价格适中的产品呢?本文将为您一网打尽十二款热门智能手表,兼顾功能与价格,总有款适合您。   、览邦Watch Ultra 览邦Watch Ultra智能手表,宛
    的头像 发表于 04-11 10:03 504次阅读
    <b class='flag-5'>一网打尽</b>十二款高端智能手表,兼顾功能与价格,总有<b class='flag-5'>一</b>款适合你!

    一网打尽 10 款降噪蓝牙耳机,兼顾功能与价格,总有款适合你!

    在繁忙的都市生活中,降噪蓝牙耳机已成为许多人不可或缺的伴侣。它们不仅能帮助我们在嘈杂的环境中保持专注,还能提供优质的音乐享受。今天,我将为大家一网打尽七款高端降噪蓝牙耳机,它们不仅功能强大,而且
    的头像 发表于 04-11 10:11 9710次阅读