MySQL之 InnoDB 記憶體結構

来源:https://www.cnblogs.com/zwhdd/archive/2023/03/29/17268132.html
-Advertisement-
Play Games

從MySQL 5.5版本開始預設 使用InnoDB作為引擎,它擅長處理事務,具有自動崩潰恢復的特性,在日常開發中使用非常廣泛 下麵是官方的InnoDB引擎架構圖,主要分為記憶體結構和磁碟結構兩大部分。 InnoDB 記憶體結構 1. Buffer Pool Buffer Pool:緩衝池,簡稱BP。其作 ...


從MySQL 5.5版本開始預設 使用InnoDB作為引擎,它擅長處理事務,具有自動崩潰恢復的特性,在日常開發中使用非常廣泛
下麵是官方的InnoDB引擎架構圖,主要分為記憶體結構磁碟結構兩大部分。
01.jpg

InnoDB 記憶體結構

1. Buffer Pool

Buffer Pool:緩衝池,簡稱BP。其作用是用來緩存表數據與索引數據,減少磁碟IO操作,提升效率。
Buffer Pool由 緩存數據頁(Page) 和 對緩存數據頁進行描述的控制塊 組成, 控制塊中存儲著對應緩存頁的所屬的 表空間、數據頁的編號、以及對應緩存頁在Buffer Pool中的地址等信息.
Buffer Pool預設大小是128M, 以Page頁為單位,Page頁預設大小16K,而控制塊的大小約為數據頁的5%,大概是800位元組。
03.jpg

註:Buffer Pool大小為128M指的就是緩存頁的大小,控制塊則一般占5%,所以每次會多申請6M的記憶體空間用於存放控制塊
如何判斷一個頁是否在BufferPool中緩存 ?
MySQl中有一個哈希表數據結構,它使用表空間號+數據頁號,作為一個key,然後緩衝頁對應的控制塊作為value。
10.jpg

  • 當需要訪問某個頁的數據時,先從哈希表中根據表空間號+頁號看看是否存在對應的緩衝頁。
  • 如果有,則直接使用;如果沒有,就從free鏈表中選出一個空閑的緩衝頁,然後把磁碟中對應的頁載入到該緩衝頁的位置

2.Page管理機制

Page頁分類

BufferPool的底層採用鏈表數據結構管理Page。在InnoDB訪問表記錄和索引時會在Page頁中緩存,以後使用可以減少磁碟IO操作,提升效率。
Page根據狀態可以分為三種類型:
05.jpg

  • ree page : 空閑page,未被使用
  • clean page:被使用page,數據沒有被修改過
  • dirty page:臟頁,被使用page,數據被修改過,頁中數據和磁碟的數據產生了不一致

Page頁如何管理

針對上面所說的三種page類型,InnoDB通過三種鏈表結構來維護和管理

1. free list 表示空閑緩衝區,管理free page
  • Buffer Pool的初始化過程中,是先向操作系統申請連續的記憶體空間,然後把它劃分成若幹個【控制塊&緩衝頁】的鍵值對。
  • free鏈表是把所有空閑的緩衝頁對應的控制塊作為一個個的節點放到一個鏈表中,這個鏈表便稱之為free鏈表
  • 基節點: free鏈表中只有一個基節點是不記錄緩存頁信息(單獨申請空間),它裡面就存放了free鏈表的頭節點的地址,尾節點的地址,還有free鏈表裡當前有多少個節點。

07.jpg
*磁碟載入頁的流程: *

  1. 從free鏈表中取出一個空閑的控制塊(對應緩衝頁)。
  2. 把該緩衝頁對應的控制塊的信息填上(例如:頁所在的表空間、頁號之類的信息)。
  3. 把該緩衝頁對應的free鏈表節點(即:控制塊)從鏈表中移除。表示該緩衝頁已經被使用了。
2.flush list:表示需要刷新到磁碟的緩衝區,管理dirty page,內部page按修改時間排序。
  • InnoDB引擎為了提高處理效率,在每次修改緩衝頁後,並不是立刻把修改刷新到磁碟上,而是在未來的某個時間點進行刷新操作. 所以需要使用到flush鏈表存儲臟頁,凡是被修改過的緩衝頁對應的控制塊都會作為節點加入到flush鏈表.
  • flush鏈表的結構與free鏈表的結構相似

08.jpg
註: 臟頁即存在於flush鏈表,也在LRU鏈表中,但是兩種互不影響,LRU鏈表負責管理page的可用性和釋放,而flush鏈表負責管理臟頁的刷盤操作。

3.lru list:表示正在使用的緩衝區,管理clean page和dirty page。

緩衝區以midpoint為基點,前面鏈表稱為new列表區,存放經常訪問的數據,占63%;後面的鏈表稱為old列表區,存放使用較少數據,占37%

普通LRU演算法

LRU = Least Recently Used(最近最少使用): 就是末尾淘汰法,新數據從鏈表頭部加入,釋放空間時從末尾淘汰.
06.jpg

  1. 當要訪問某個頁時,如果不在Buffer Pool,需要把該頁載入到緩衝池,並且把該緩衝頁對應的控制塊作為節點添加到LRU鏈表的頭部。
  2. 當要訪問某個頁時,如果在Buffer Pool中,則直接把該頁對應的控制塊移動到LRU鏈表的頭部
  3. 當需要釋放空間時,從最末尾淘汰

普通LRU鏈表的優缺點
優點: 所有最近使用的數據都在鏈表表頭,最近未使用的數據都在鏈表表尾,保證熱數據能最快被獲取到
缺點:

  1. 如果發生全表掃描(比如:沒有建立合適的索引 or 查詢時使用select * 等),則有很大可能將真正的熱數據淘汰掉.
  2. 由於MySQL中存在預讀機制,很多預讀的頁都會被放到LRU鏈表的表頭。如果這些預讀的頁都沒有用到的話,這樣,會導致很多尾部的緩衝頁很快就會被淘汰。

02.jpg

改進型LRU演算法

改性LRU:鏈表分為new和old兩個部分,加入元素時並不是從表頭插入,而是從中間midpoint位置插入(就是說從磁碟中新讀出的數據會放在冷數據區的頭部),如果數據很快被訪問,那麼page就會向new列表頭部移動,如果數據沒有被訪問,會逐步向old尾部移動,等待淘汰。
11.jpg
冷數據區的數據頁什麼時候會被轉到到熱數據區呢 ?

  1. 如果該數據頁在LRU鏈表中存在時間超過1s,就將其移動到鏈表頭部 ( 鏈表指的是整個LRU鏈表)
  2. 如果該數據頁在LRU鏈表中存在的時間短於1s,其位置不變(由於全表掃描有一個特點,就是它對某個頁的頻繁訪問總耗時會很短)
  3. 1s這個時間是由參數 innodb_old_blocks_time 控制的

3. Change Buffer

change Buffer基本概念

Change Buffer:寫緩衝區,是針對二級索引(輔助索引) 頁的更新優化措施
Change Buffer作用: 在進行DML操作時,如果請求的是 輔助索引(非唯一鍵索引)沒有在緩衝池 中時,並不會立刻將磁碟頁載入到緩衝池,而是在CB記錄緩衝變更,等未來數據被 讀取時,再將數據合併恢復到BP中。
ChangeBuffer占用BufferPool空間,預設占25%,最大允許占50%,可以根據讀寫 業務量來進行調整。參數innodb_change_buffer_max_size;
43.jpg

  1. ChangeBuffer用於存儲SQL變更操作,比如Insert/Update/Delete等SQL語句
  2. ChangeBuffer中的每個變更操作都有其對應的數據頁,並且該數據頁未載入到緩存中;
  3. 當ChangeBuffer中變更操作對應的數據頁載入到緩存中後,InnoDB會把變更操作Merge到數據頁上;
  4. InnoDB會定期載入ChangeBuffer中操作對應的數據頁到緩存中,並Merge變更操作

change buffer更新流程

情況1: 對於唯一索引來說,需要將數據頁讀入記憶體,判斷到沒有衝突,插入這個值,語句執行結束;
情況2: 對於普通索引來說,則是將更新記錄在 change buffer,流程如下:

  1. 更新一條記錄時,該記錄在BufferPool存在,直接在BufferPool修改,一次記憶體操作。

  2. 如果該記錄在BufferPool不存在(沒有命中),在不影響數據一致性的前提下,InnoDB 會將這些更新操作緩存在 change buffer 中不用再去磁碟查詢數據,避免一次磁碟IO。

  3. 當下次查詢記錄時,會將數據頁讀入記憶體,然後執行change buffer中與這個頁有關的操作.通過這種方式就能保證這個數據邏輯的正確性。

    12.jpg

寫緩衝區,僅適用於非唯一普通索引頁,為什麼?

如果在索引設置唯一性,在進行修改時,InnoDB必須要做唯一性校驗,因此必須查詢磁碟,做一次IO操作。會直接將記錄查詢到BufferPool中,然後在緩衝池修改,不會在ChangeBuffer操作。

什麼情況下進行 merge ?

將 change buffer 中的操作應用到原數據頁,得到最新結果的過程稱為merge .
change buffer,實際上它是可以持久化的數據。也就是說,change buffer 在記憶體中有拷貝,也會被寫入到磁碟上,以下情況會進行持久化:

  1. 訪問這個數據頁會觸發 merge
  2. 系統有後臺線程會定期 merge。
  3. 在資料庫正常關閉(shutdown)的過程中,也會執行 merge 操作。

Change Buffer 的使用場景

  • change buffer 的主要目的就是將記錄的變更動作緩存下來,所以在merge發生之前應 當儘可能多的緩存變更信 息,這樣 change buffer的優勢發揮的就越明顯.
  • 應用場景: 對於寫多讀少的業務來說,頁面在寫完以後馬上被訪問到的概率比較小,此時 change buffer 的使用 效果最好。這種業務模型常見的就是賬單類、日誌類的系統。

4. Log Buffer

Log Buffer:日誌緩衝區,用來保存要寫入磁碟上log文件(Redo/Undo)的數據,日誌緩衝區的內容定期刷新到磁碟log文件中。日誌緩衝區滿時會自動將其刷新到磁碟,當遇到BLOB或多行更新的大事務操作時,增加日誌緩衝區可以節省磁碟I/O。
LogBuffer主要作用是: 用來優化每次更新操作之後都要寫入redo log 而產生的磁碟IO問題.
14.jpg
LogBuffer空間滿了,會自動寫入磁碟。可以通過將innodb_log_buffer_size參數調大,減少磁碟IO頻率

本文來自博客園,作者:笨笨的二黃子,轉載請註明原文鏈接:https://www.cnblogs.com/zwhdd/p/17268132.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 參考:(25條消息) 虛擬機安裝Arch Linux_虛擬機安裝archlinux_追光少年羽的博客-CSDN博客 準備工作 在開始安裝 Arch Linux 之前,需要先下載安裝映像文件並創建好虛擬機環境。 下載安裝鏡像 下麵是 Arch Linux 官方的安裝文件下載地址: Arch Linux ...
  • 解決辦法 如果最近升級到了 openssh 8.8 版,你會發現連接某些之前連接得好好的伺服器突然無法連接: Unable to negotiate with x.x.x.x port 2222: no matching host key type found. Their offer: ssh-r ...
  • 1. 三值邏輯 1.1. 真 1.1.1. true 1.2. 假 1.2.1. false 1.3. 不確定 1.3.1. unknown 2. 兩種NULL 2.1. 未知”(unknown) 2.1.1. 不知道戴墨鏡的人眼睛是什麼顏色 2.1.2. 雖然現在不知道,但加上某些條件後就可以知道 ...
  • 通過Hbase與Cassandra對比,層次展開瞭解Apache Cassandra特性和使用場景,通過部署但實力和多實例集群進一步理解其運作,最後通過CQL及其客戶端命令工具理解其數據模型和數據類型,通過對鍵空間、表、索引、數據操作熟悉常見CQL語法和使用。 ...
  • 所需準備 1.安裝資料庫實例,如SQLEXPRADV_x64_CHS 2.安裝資料庫管理軟體,如SQL Server Management Studio 操作步驟 1.打開SQL Server Management Studio,使用Windows身份驗證登入。 2.點擊伺服器實例,右鍵屬性->安全 ...
  • Redis資料庫 Redis(Remote Dictionary Server)是一個使用 C 語言編寫的,高性能非關係型的鍵值對資料庫。與傳統資料庫不同的是,Redis 的數據是存在記憶體中的,所以讀寫速度非常快,被廣泛應用於緩存方向。Redis可以將數據寫入磁碟中,保證了數據的安全不丟失,而且Re ...
  • RMAN備份時會記錄每一次備份的狀態信息,例如COMPLETED,FAILED等,但是使用下麵腳本查詢資料庫時,偶爾你會看到有些備份的狀態為COMPLETED WITH WARNINGS SET LINESIZE 1080;COL STATUS FORMAT A9;COL START_TIME FO ...
  • 摘要:智能把控大數據量查詢,防患系統奔潰於未然。 本文分享自華為雲社區《拒絕“爆雷”!GaussDB(for MySQL)新上線了這個功能》,作者:GaussDB 資料庫。 什麼是最大讀取行 一直以來,大數據量查詢是資料庫DBA們調優的重點,DBA們通常十八般武藝輪番上陣以期提升大數據查詢的性能:例 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...