B+Tree索引原理

来源:https://www.cnblogs.com/noneplus/archive/2019/09/23/11570105.html
-Advertisement-
Play Games

什麼是索引? 索引是一種數據結構,具體表現在查找演算法上。 索引目的 提高查詢效率 【類比字典和借書】 如果要查“mysql”這個單詞,我們肯定需要定位到m字母,然後從下往下找到y字母,再找到剩下的sql。如果沒有索引,那麼你可能需要把所有單詞看一遍才能找到你想要的。 去圖書館借書也是一樣,如果你要借 ...


什麼是索引?

索引是一種數據結構,具體表現在查找演算法上。


索引目的

提高查詢效率

【類比字典和借書】

如果要查“mysql”這個單詞,我們肯定需要定位到m字母,然後從下往下找到y字母,再找到剩下的sql。如果沒有索引,那麼你可能需要把所有單詞看一遍才能找到你想要的。

去圖書館借書也是一樣,如果你要借某一本書,一定是先找到對應的分類科目,再找到對應的編號,這是生活中活生生的例子,通用索引,可以加快查詢速度,快速定位。


數據結構——樹

1569125791215

二叉樹

每個節點最多含有兩個子樹的樹稱為二叉樹。


二叉查找樹ADT Tree

左子樹的鍵值小於根的鍵值,右子樹的鍵值大於根的鍵值。

img

平衡二叉樹AVL Tree

在符合二叉查找樹的條件下,還滿足任何節點的兩個子樹的高度最大差為1。

BTree

BTree也稱為平衡多路查找樹

B-Tree是為磁碟等外存儲設備設計的一種平衡查找樹。

1569143287075

B+Tree

B+Tree是在B-Tree基礎上的一種優化

  • 非葉子結點只存儲鍵值信息,不存儲數據
  • 所有的葉子結點都有一個鏈指針
  • 數據記錄都存放在葉子結點中

1569143297523


MySQL預設使用B+Tree索引

索引本身也很大,所以存儲在磁碟中,需要載入到記憶體中執行。

故:索引結構優劣標準:磁碟I/O次數


BTree是為了充分利用磁碟預讀功能而創建出來的一種數據結構。

局部性原理和磁碟預讀

局部性原理:當一個數據被用到,其附近的數據很可能會馬上用到

磁碟預讀:由於存儲介質的特性,磁碟本身存取就比主存慢很多,再加上機械運動耗費,磁碟的存取速度往往是主存的幾百分分之一,因此為了提高效率,要儘量減少磁碟I/O。為了達到這個目的,磁碟往往不是嚴格按需讀取,而是每次都會預讀,即使只需要一個位元組,磁碟也會從這個位置開始,順序向後讀取一定長度的數據放入主存。


為什麼平衡二叉樹無法利用磁碟預讀功能而BTree可以?

平衡二叉樹也稱為紅黑數,在邏輯上是平衡二叉樹,但是在物理存儲上使用的是數組,邏輯上相近的節點可能在物理上相差很遠。


BTree如何利用磁碟預讀功能?

將節點大小設為等於一個頁,BTree新建節點時,也是按照頁為單位申請,同時電腦存儲分配也是按頁對齊,那麼一個節點只需一次IO就可以讀取全部節點數據。

【如果節點大小和BTree大小不對齊,那麼同一頁節點可能需要兩次IO讀取】

綜上所述,用B-Tree作為索引結構效率是非常高的。


為什麼B+Tree比BTree更適合作為索引結構?

BTree解決了磁碟IO的問題但沒有解決元素遍歷複雜的問題。

B+Tree的葉子節點用鏈指針相連,極大提高區間訪問速度。【比如查詢50到100的記錄,查出50後,順著指針遍歷即可】

為什麼不使用Hash索引而使用B+Tree索引?

Hash索引本質上是Hash表,是一種KV鍵值對的存儲結構。

無法提高區間訪問速度。

B+Tree的葉子結點可以存哪些東西?

可能是整行數據,也可能是主鍵的值。

前者被稱為聚簇索引,後者稱為非聚簇索引。

聚簇索引更快!!!

為什麼???聚簇索引已經查到整行數據了,而非聚簇索引還可能根據主鍵值再進行查詢一次。

例外:覆蓋索引——數據直接從索引中取得。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 參考博客地址: http://www.cnblogs.com/qqlin/archive/2012/10/16/2717964.html https://www.cnblogs.com/lyps/p/10560256.html 這篇文章主要介紹.NET Framework下麵的IOC以及Unity的 ...
  • Linux基礎知識之文件許可權(一) Linux優點之一就是它擁有多用戶多任務的環境,在提供文件共用的同時也能保證用戶文件的安全性。所以,設置文件的許可權管理變得尤為重要。 Linux基礎知識之文件許可權(一) 1. 基礎許可權 1.1許可權講解 1.2 許可權更改 chgrp:改變文件的所屬群組 chmod ...
  • Storage 6 網路架構 Storag 6 網路環境配置 主機名 Public網路 管理網路 集群網路 說明 admin 192.168.2.39 172.200.50.39 管理節點 node001 192.168.2.40 172.200.50.40 192.168.3.40 MON,OSD ...
  • 1. 添加隔離標記符: ip netns add fd 2. 將指定網卡放入隔離中: ip link set eth1 netns fd 3. 在隔離環境下執行命令: ip netns exec fd ifconfig eth1 down ip netns exec fd ifconfig eth1 ...
  • 一、獲取網卡名稱 一、獲取網卡名稱 ip a ifconfig(安裝net-tools後可用) ip a ifconfig(安裝net-tools後可用) 二、進入網卡配置文件所在路徑 cd /etc/sysconfig/network-scripts/ 三、編輯網卡配置文件 Vi ifcfg-en ...
  • 一、網路源 二、配置源 三、配置本地源 編輯本地源 vim dvd.repo 四、 永久掛載 五、本地yum源搭建完成 ...
  • 背景 By 魯迅 By 高爾基 說明: 1. Kernel版本:4.14 2. ARM64處理器,Contex A53,雙核 3. 使用工具:Source Insight 3.5, Visio 1. 介紹 在 "(四)Linux記憶體模型之Sparse Memory Model" 中,我們分析了 函數 ...
  • 在docker中運行第三方服務時,通常需要綁定服務埠到本地主機。但使用 -p 參數進行的埠映射,會自動在iptables中建立規則,繞過firewalld,這對於埠級的黑白名單控制管理是很不利的,所以我們需要對iptables進行手動修改。 這裡以從名為centos.19.09.05的imag ...
一周排行
    -Advertisement-
    Play Games
  • 基於.NET Framework 4.8 開發的深度學習模型部署測試平臺,提供了YOLO框架的主流系列模型,包括YOLOv8~v9,以及其系列下的Det、Seg、Pose、Obb、Cls等應用場景,同時支持圖像與視頻檢測。模型部署引擎使用的是OpenVINO™、TensorRT、ONNX runti... ...
  • 十年沉澱,重啟開發之路 十年前,我沉浸在開發的海洋中,每日與代碼為伍,與演算法共舞。那時的我,滿懷激情,對技術的追求近乎狂熱。然而,隨著歲月的流逝,生活的忙碌逐漸占據了我的大部分時間,讓我無暇顧及技術的沉澱與積累。 十年間,我經歷了職業生涯的起伏和變遷。從初出茅廬的菜鳥到逐漸嶄露頭角的開發者,我見證了 ...
  • C# 是一種簡單、現代、面向對象和類型安全的編程語言。.NET 是由 Microsoft 創建的開發平臺,平臺包含了語言規範、工具、運行,支持開發各種應用,如Web、移動、桌面等。.NET框架有多個實現,如.NET Framework、.NET Core(及後續的.NET 5+版本),以及社區版本M... ...
  • 前言 本文介紹瞭如何使用三菱提供的MX Component插件實現對三菱PLC軟元件數據的讀寫,記錄了使用電腦模擬,模擬PLC,直至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1. PLC開發編程環境GX Works2,GX Works2下載鏈接 https:// ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • 1、jQuery介紹 jQuery是什麼 jQuery是一個快速、簡潔的JavaScript框架,是繼Prototype之後又一個優秀的JavaScript代碼庫(或JavaScript框架)。jQuery設計的宗旨是“write Less,Do More”,即倡導寫更少的代碼,做更多的事情。它封裝 ...
  • 前言 之前的文章把js引擎(aardio封裝庫) 微軟開源的js引擎(ChakraCore))寫好了,這篇文章整點js代碼來測一下bug。測試網站:https://fanyi.youdao.com/index.html#/ 逆向思路 逆向思路可以看有道翻譯js逆向(MD5加密,AES加密)附完整源碼 ...
  • 引言 現代的操作系統(Windows,Linux,Mac OS)等都可以同時打開多個軟體(任務),這些軟體在我們的感知上是同時運行的,例如我們可以一邊瀏覽網頁,一邊聽音樂。而CPU執行代碼同一時間只能執行一條,但即使我們的電腦是單核CPU也可以同時運行多個任務,如下圖所示,這是因為我們的 CPU 的 ...
  • 掌握使用Python進行文本英文統計的基本方法,並瞭解如何進一步優化和擴展這些方法,以應對更複雜的文本分析任務。 ...
  • 背景 Redis多數據源常見的場景: 分區數據處理:當數據量增長時,單個Redis實例可能無法處理所有的數據。通過使用多個Redis數據源,可以將數據分區存儲在不同的實例中,使得數據處理更加高效。 多租戶應用程式:對於多租戶應用程式,每個租戶可以擁有自己的Redis數據源,以確保數據隔離和安全性。 ...