MYSQL-->InnoDB引擎底层原理

逻辑存储结构逻辑存储结构图

MYSQL-->InnoDB引擎底层原理

文章插图
  1. 表空间
    表空间文件在Linux下存放在 /var/lib/mysql文件中的 xxx.ibd 文件就是表空间文件
    表空间文件用来存储,记录,索引等数据 。

  2. 段分为,数据段(Leaf node segment) ,索引段(Non-leaf node segment),回滚段(Rollback segment),InnoDB是索引组织表,数据段就是B+树的叶子节点,索引段就是非叶子节点,段用来管理Extend(区) 。
    一个段相当于一张表

  3. 区是表空间的单元结构,每个区大小为1M,默认情况下InnoDB存储引擎页大小为16k,一个区一共16个连续的页 。

  4. 页,是InnoDB存储引擎磁盘管理的最小单元 。
    每个区默认16KB,为了保证页的连续性,InnoDB存储引擎每次从磁盘申请4到5个区 。

  5. 行指的是InnoDB存储的数据
    表结构中俩个隐藏字段
    Trx_id:最后一次操作事务的id
    Roll pointer:指针,指向增删改之前的数据,可以拿这个找到修改之前的数据 。
架构MySQL5.5版本后,默认使用InoDB存储引擎 。
它擅长事务处理,具有崩溃恢复性特性!
下图为InnoDB架构图,左边为内存结构,右边为磁盘结构 。
MYSQL-->InnoDB引擎底层原理

文章插图
内存结构
MYSQL-->InnoDB引擎底层原理

文章插图
Buffer Pool(缓冲池)缓冲池是主内存的一个区域,里面可以缓存磁盘上经常操作的真实数据 。
在执行增删改查操作的时候,先操作缓存池中的数据(如果没有,从磁盘加载并且缓存)
然后以一定频率刷新到磁盘,从而减少磁盘IO,加快处理速度
在缓存池中有一块一块的,这个是页 。
缓存池以页为单位,底层采用链表数据结构管理Page 。
根据状态将Page分为三类:
  1. free page :空闲页,未被使用的页 。
  2. clean page   :被使用的页,数据没有被修改过 。
  3. dirty page    :脏页,被使用的页,页中数据和磁盘中数据不一致 。
Change Buffer(更改缓存区)介绍
更改缓存区,主要针对非唯一的二级索引 。
在执行DML语句时,如果这些数据页不在Buffer Poor中,不会直接操作磁盘,而是将数据变更在更改缓存区Change Buffer中 。
在未来数据被读取的时候,再将数据合并恢复到Buffer Pool中,再将合并后的数据刷新到磁盘中 。
意义
和聚集索引不同,二级索引是非唯一的!
并且二级索引以相对随机的顺序插入 。
同样的删除和更新可能会影响索引树中不相邻的二级索引页,如果每一次都操作磁盘,会造成大量磁盘IO 。
有了ChangeBuffer后,我们可以在缓冲池中进行合并处理减少磁盘IO
Log Buffer(日志缓存区)日志缓存区,用来保存要写入磁盘中的log日志数据(redo log 、undo log) 。
默认大小16MB,日志缓存区的日志会定期刷新到磁盘中 。如果需要更新、插入、或删除多行的事务,增加日志缓存区大小可以节约磁盘IO
在系统变量中设置即可
关键字:
innodb_log_buffer_size 缓存区大小
innodb_flush_log_at_trx_commit 日志刷新到磁盘的时机
1代表的是日志在每次事务提交时写入并刷新到磁盘
0代表每秒将日志写入并刷新到磁盘一次
2代表日志在每次事务提交后写入,并且每秒刷新到磁盘一次
Adaaptive Hash index(自适应哈希索引)自适应哈希索引,用于优化Buffer Pool数据的查询 。

经验总结扩展阅读