MySQL源碼解析之執行計劃

来源:https://www.cnblogs.com/greatsql/archive/2022/08/08/16560603.html
-Advertisement-
Play Games

MySQL源碼解析之執行計劃 MySQL執行計劃介紹 MySQL執行計劃代碼概覽 MySQL執行計劃總結 一、MySQL執行計劃介紹 在MySQL中,執行計劃的實現是基於JOIN和QEP_TAB這兩個對象。其中JOIN類表示一個查詢語句塊的優化和執行,每個select查詢語句(即Query_bloc ...


MySQL源碼解析之執行計劃

  • MySQL執行計劃介紹
  • MySQL執行計劃代碼概覽
  • MySQL執行計劃總結

一、MySQL執行計劃介紹

在MySQL中,執行計劃的實現是基於JOINQEP_TAB這兩個對象。其中JOIN類表示一個查詢語句塊的優化和執行,每個select查詢語句(即Query_block對象)在處理的時候,都會被當做JOIN對象,其定義在sql/sql_optimizer.h

QEP_TABQuery Execution Plan Table的縮寫,這裡的表Table對象主要包含物化表、臨時表、派生表、常量表等。JOIN::optimize()是優化執行器的統一入口,在這裡會把一個查詢語句塊Query_block最終優化成QEP_TAB

MySQL-8.0.22版本之後,又引入訪問方式AccessPath和執行迭代器Iterator對象,再結合JOIN和QEP_TAB對象,最終得到整個解析計劃的執行路徑。

二、MySQL執行計劃代碼概覽

本文主要基於MySQL-8.0.25版本,進行說明。

優化器的入口函數:bool JOIN::optimize(),對應代碼文件sql/sql_optimizer.cc

// 主要功能是把一個查詢塊Query_block優化成一個QEP_TAB,得到AccessPath
bool JOIN::optimize() { 
	...
	// 下麵主要是為了可以藉助INFORMATION_SCHEMA.OPTIMIZER_TRACE表,跟蹤優化器的執行狀態和執行步驟
	Opt_trace_context *const trace = &thd->opt_trace;
	Opt_trace_object trace_wrapper(trace);
	Opt_trace_object trace_optimize(trace, "join_optimization");
	trace_optimize.add_select_number(Query_block->select_number);
	Opt_trace_array trace_steps(trace, "steps");
	...
	// 視窗函數裝配優化
	if (has_windows && Window::setup_windows2(thd, m_windows))
	...
	// 拷貝Query_block上的條件副本到JOIN結構關聯的成員對象,為後續優化做準備
	if (Query_block->get_optimizable_conditions(thd, &where_cond, &having_cond))
	...
	// 統計抽象語法樹中的葉節點表,其中leaf_tables是在Query_block::setup_tables中進行裝配
	tables_list = Query_block->leaf_tables;
	...
	// 分區裁剪
	if (Query_block->partitioned_table_count && prune_table_partitions()) {
	...
	// 嘗試把聚合函數COUNT()、MIN()、MAX()對應的值,替換成常量
	if (optimize_aggregated_query(thd, Query_block, *fields, where_cond,
																&outcome)) {
	...
	// 採用超圖演算法生成執行計劃,註意超圖演算法通過set optimizer_switch="hypergraph_optimizer=on"方式啟用
	if (thd->lex->using_hypergraph_optimizer) {
		FindBestQueryPlan(thd, Query_block, /*trace=*/nullptr);
		// 如果Join優化器是超圖演算法,處理結束直接返回
		return false;
	}
	...

下麵代碼主要涉及Join優化器連接方式為左深樹的情況,主要用到join_tab數組來進行組織關聯

根據代價計算表的連接方式,核心函數make_join_plan(),實現非常複雜。比較關鍵的函數是bool Optimize_table_order::choose_table_order()

其主要思想是通過貪婪搜索Optimize_table_order::greedy_search,根據最小的連接代價,進行有限的窮舉搜索(細節參考Optimize_table_order::best_extension_by_limited_search)

最終找到近似最優解的連接排列組合

	if (make_join_plan()) {
	...
	// 語句塊謂詞條件下推,提升過濾性能
	if (make_join_Query_block(this, where_cond)) {
	...
	// 優化order by/distinct語句
	if (optimize_distinct_group_order()) return true;
	...
	// 分配QEP_TAB數組
	if (alloc_qep(tables)) return (error = 1); /* purecov: inspected */
	...
	// 執行計劃細化,優化子查詢和半連接的情況,具體策略可以參考mariadb的文檔:
	// https:// mariadb.com/kb/en/optimization-strategies/
	// 關鍵代碼是setup_semijoin_dups_elimination,主要對半連接關聯的策略進行裝配
	if (make_join_readinfo(this, no_jbuf_after))
	...
	// 為處理group by/order by創建開闢臨時表空間
	if (make_tmp_tables_info()) return true;
	...
	// 生成訪問方式AccessPath,供後續迭代器Iterator訪問使用
	create_access_paths();
	...
	return false;
}

三、MySQL執行計劃總結

MySQL的執行計劃是整個資料庫最核心的模塊,其代碼也在不斷地迭代更新過程中。執行計劃中優化器的好壞和背後的搜索策略、數學模型緊密相關。MySQL支持的搜索策略有窮舉搜索、貪婪搜索,對應的Join優化器有左深樹演算法和超圖演算法,整個優化過程主要是基於CBO策略進行優化。

執行計劃運行的過程,實際上就是一個動態規劃的過程。這個過程的優劣,快慢決定了MySQL和主流商業資料庫的差距。只有深入地理解MySQL優化器的運行原理,才能幫助我們積極有效地探索更高性能優化的可能。
最後由於筆者知識水平有限,疏漏之處,還望斧正。


Enjoy GreatSQL

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. TriCore與中斷的簡介 TriCore是德國英飛凌科技公司旗下的第一個為實時嵌入式系統而優化的統一的、32位的微控制器-DSP(Digital Signal Processing)處理器架構。TriCore的ISA(Instruction Set Architecture),即指令集體繫結 ...
  • 博德之門:黑暗聯盟2是一款原始畫風奇幻探索動作冒險游戲,商隊遇難,僅剩的守衛也已受傷,邪惡力量再次回到了傳說中的博德之門,玩家需要狡猾的戰士和大膽的法師從威脅所有人的黑魔法中奪回博德之門,快拿起你的武器參加戰鬥吧! 詳情:博德之門:黑暗聯盟2 for mac(迷宮探索游戲) 簡單介紹 在這個地牢爬行 ...
  • PreviewMarkdown Mac版是一款功能強大的Markdown編輯預覽軟體,為使用流行的 Markdown 標記格式創建的文檔提供 QuickLook 文件預覽和文件圖標縮略圖。 詳情:PreviewMarkdown for Mac(Markdown編輯預覽軟體) 簡單介紹 Preview ...
  • 定義: 刪除數據表就是將資料庫中已經存在的表從資料庫中刪除。註意,在刪除表的同時,表的定義和表中所有的數據均會被刪除。因此,在進行刪除操作前,最好對錶中的數據做一個備份,以免造成無法輓回的後果。本節將詳細講解資料庫表的刪除方法。 1 刪除一個或多個沒有被其他表關聯的數據表 如果一個數據表沒有和其它表 ...
  • Orange是提高工作便利性的 集成開發工具 可以極大方便資料庫管理和 用戶的數據訪問進程 Orange是 DB運營管理和開發解決方案 通過方便而又強大的功能 快速可視化編程前端 以便瀏覽數據分析和可視化 開發商介紹 Ware Valley成立於2001年,是一家全球性的軟體公司,也是南韓唯一一個為 ...
  • 更多技術交流、求職機會、試用福利,歡迎關註位元組跳動數據平臺微信公眾號,回覆【1】進入官方交流群 序言 埋點數據作為推薦、搜索、產品優化的基石,其數據質量的重要性不言而喻,而要保障埋點數據的質量,埋點驗證則首當其衝。工欲善其事必先利其器,要做好埋點驗證會面臨很多技術挑戰:易用性、準確性、實時性、穩定性 ...
  • 一、數字營銷是數字化轉型排頭兵 《⼗四五數字經濟發展規劃》中強調,要⼤⼒推進數字化轉型,形成數據驅動的智能決策能⼒,提升企業整體運營效率。 要做好數字化轉型,企業可從產、研、供、銷、⽤等多個環節入手,而 “銷” 恰好是第一關鍵要素,企業轉型往往從營銷場景入手,因此我們說數字化營銷是企業數字化轉型的排 ...
  • vivo 互聯網伺服器團隊 - Wang Zhi 一、業務背景 從技術的角度來說,技術方案的選型都是受限於實際的業務場景,都以解決實際業務場景為目標。 在我們的實際業務場景中,需要以游戲的維度收集和上報行為數據,考慮數據的量級,執行盡最大努力交付且允許數據的部分丟棄。 數據上報支持游戲的維度的批量上 ...
一周排行
    -Advertisement-
    Play Games
  • 前言 在我們開發過程中基本上不可或缺的用到一些敏感機密數據,比如SQL伺服器的連接串或者是OAuth2的Secret等,這些敏感數據在代碼中是不太安全的,我們不應該在源代碼中存儲密碼和其他的敏感數據,一種推薦的方式是通過Asp.Net Core的機密管理器。 機密管理器 在 ASP.NET Core ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 順序棧的介面程式 目錄順序棧的介面程式頭文件創建順序棧入棧出棧利用棧將10進位轉16進位數驗證 頭文件 #include <stdio.h> #include <stdbool.h> #include <stdlib.h> 創建順序棧 // 指的是順序棧中的元素的數據類型,用戶可以根據需要進行修改 ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • C總結與剖析:關鍵字篇 -- <<C語言深度解剖>> 目錄C總結與剖析:關鍵字篇 -- <<C語言深度解剖>>程式的本質:二進位文件變數1.變數:記憶體上的某個位置開闢的空間2.變數的初始化3.為什麼要有變數4.局部變數與全局變數5.變數的大小由類型決定6.任何一個變數,記憶體賦值都是從低地址開始往高地 ...
  • 如果讓你來做一個有狀態流式應用的故障恢復,你會如何來做呢? 單機和多機會遇到什麼不同的問題? Flink Checkpoint 是做什麼用的?原理是什麼? ...
  • C++ 多級繼承 多級繼承是一種面向對象編程(OOP)特性,允許一個類從多個基類繼承屬性和方法。它使代碼更易於組織和維護,並促進代碼重用。 多級繼承的語法 在 C++ 中,使用 : 符號來指定繼承關係。多級繼承的語法如下: class DerivedClass : public BaseClass1 ...
  • 前言 什麼是SpringCloud? Spring Cloud 是一系列框架的有序集合,它利用 Spring Boot 的開發便利性簡化了分散式系統的開發,比如服務註冊、服務發現、網關、路由、鏈路追蹤等。Spring Cloud 並不是重覆造輪子,而是將市面上開發得比較好的模塊集成進去,進行封裝,從 ...
  • class_template 類模板和函數模板的定義和使用類似,我們已經進行了介紹。有時,有兩個或多個類,其功能是相同的,僅僅是數據類型不同。類模板用於實現類所需數據的類型參數化 template<class NameType, class AgeType> class Person { publi ...
  • 目錄system v IPC簡介共用記憶體需要用到的函數介面shmget函數--獲取對象IDshmat函數--獲得映射空間shmctl函數--釋放資源共用記憶體實現思路註意 system v IPC簡介 消息隊列、共用記憶體和信號量統稱為system v IPC(進程間通信機制),V是羅馬數字5,是UNI ...