淺談一致性Hash原理及應用

来源:https://www.cnblogs.com/xialihua1023/archive/2019/01/22/10304932.html
-Advertisement-
Play Games

在講一致性Hash之前我們先來討論一個問題。 問題:現在有億級用戶,每日產生千萬級訂單,如何將訂單進行分片分表? 小A:我們可以按照手機號的尾數進行分片,同一個尾數的手機號寫入同一片/同一表中。 大佬:我希望通過會員ID來查詢這個會員的所有訂單信息,按照手機號分片/分表的話,前提是需要該用戶的手機號 ...


  在講一致性Hash之前我們先來討論一個問題。

  問題:現在有億級用戶,每日產生千萬級訂單,如何將訂單進行分片分表?

  小A:我們可以按照手機號的尾數進行分片,同一個尾數的手機號寫入同一片/同一表中。

  大佬:我希望通過會員ID來查詢這個會員的所有訂單信息,按照手機號分片/分表的話,前提是需要該用戶的手機號保持不變,並且在查詢訂單列表時需要提前查詢該用戶的手機號,利用手機號尾數不太合理。

  小B:按照大佬的思路,我們需要找出一個唯一不變的屬性來進行分片/分表。

  大佬:迷之微笑~

  小B:(信心十足)會員在我們這邊保持不變的就是會員ID(int),我們可以通過會員ID的尾數進行分片/分表

  小C:盡然我們可以用會員ID尾數進行分片/分表,那就用取模的方式來進行分片/分表,通過取模的方式可以達到很好的平衡性。示意圖如下:

   取模理論

  大佬:嗯嗯嗯,在不考慮會員冷熱度的情況下小B和小C說的方案絕佳;但是往往我們的會員有冷熱度和僵屍會員,通過取模的方式往往會出現某個分片數據異常高,部分分片數據異常低,導致平衡傾斜。示意圖如下:

  

  大佬:當出現某個分片/分表達到極限時我們需要添加片/表,此時發現我們無法正常添加片/表。因為一旦添加片/或表的時候會導致絕大部分數據錯亂,按照原先的取模方式是無法正常獲取數據的。示意圖如下

  

 

 

添加分片/分表前4,5,6會員的訂單分別存儲在A,B,C上,當添加了片/表的時候在按照(會員ID%N)方式取模去取數據4,5,6會員的訂單數據時發現無法取到訂單數據,因為此時4,5,6這三位會員數據分佈存在了D,E,A上,具體示意圖如下: 

  

  大佬:所以通過取模的方式也會存在缺陷;好了接下來我們來利用一致hash原理的方式來解決分片/分表的問題。

 首先什麼是一致性哈希演算法?一致性哈希演算法(Consistent Hashing Algorithm)是一種分散式演算法,常用於負載均衡。Memcached client也選擇這種演算法,解決將key-value均勻分配到眾多Memcached server上的問題。它可以取代傳統的取模操作,解決了取模操作無法應對增刪Memcached Server的問題(增刪server會導致同一個key,在get操作時分配不到數據真正存儲的server,命中率會急劇下降)。

   還以上述問題為例,假如我們有10片,我們利用Hash演算法將每一片算出一個Hash值,而這些Hash點將被虛擬分佈在Hash圓環上,理論視圖如下:  

  

  按照順時針的方向,每個點與點之間的弧形屬於每個起點片的容量,然後按照同樣的Hash計算方法對每個會員ID進行Hash計算得出每個Hash值然後按照區間進行落片/表,以保證數據均勻分佈。

如果此時需要在B和C之間新增一片/表(B1)的話,就不會出現按照取模形式導致數據幾乎全部錯亂的情況,僅僅是影響了(B1,C)之間的數據,這樣我們清洗出來也就比較方便,也不會出現數據大批量

癱瘓。

  但是如果我們僅僅是將片/表進行計算出Hash值之後,這些點分佈並不是那麼的均勻,比如就會下麵的這種情況,導致區間傾斜。如圖

  這個時候虛擬節點就此誕生,下麵讓我們來看一下虛擬節點在一致性Hash中的作用。當我們在Hash環上新增若幹個點,那麼每個點之間的距離就會接近相等。按照這個思路我們可以新增若幹個

片/表,但是成本有限,我們通過複製多個A、B、C的副本({A1-An},{B1-Bn},{C1-Cn})一起參與計算,按照順時針的方向進行數據分佈,按照下圖示意:

  

此時A=[A,C1)&[A1,C2)&[A2,B4)&[A3,A4)&[A4,B1);B=[B,A1)&[B2,C)&[B3,C3)&[B4,C4)&[B1,A);C=[C1,B)&[C2,B2)&[C,B3)&[B3,C3)&[C4,A3);由圖可以看出分佈點越密集,平衡性約好。

 

 1 using System;
 2 using System.Collections.Generic;
 3 using System.Data.HashFunction;
 4 using System.Data.HashFunction.xxHash;
 5 using System.Linq;
 6 
 7 namespace HashTest
 8 {
 9     public class ConsistentHash
10     {
11         /// <summary>
12         /// 虛擬節點數
13         /// </summary>
14         private static readonly int VirturalNodeNum = 10;
15 
16         /// <summary>
17         /// 伺服器IP
18         /// </summary>
19         private static readonly string[] Nodes = { "192.168.1.1", "192.168.1.2", "192.168.1.3"};
20 
21         /// <summary>
22         /// 按照一致性Hash進行分組
23         /// </summary>
24         private static readonly IDictionary<uint, string> ConsistentHashNodes = new Dictionary<uint, string>();
25 
26         private static uint[] _nodeKeys = null;
27                
28         public static void ComputeNode()
29         {
30             foreach (var node in Nodes)
31             {
32                 AddNode(node);
33             }
34         }
35 
36         private static void AddNode(string node)
37         {
38             for (int i = 0; i < VirturalNodeNum; i++)
39             {
40                 var key = node + ":" + i;
41                 var hashValue = ComputeHash(key);
42                 if (!ConsistentHashNodes.ContainsKey(hashValue))
43                 {
44                     ConsistentHashNodes.Add(hashValue, node);
45                 }
46             }
47 
48             _nodeKeys = ConsistentHashNodes.Keys.ToArray();
49         }
50 
51         private static uint ComputeHash(string virturalNode)
52         {
53             var hashFunction = xxHashFactory.Instance.Create();
54             var hashValue = hashFunction.ComputeHash(virturalNode);
55             return BitConverter.ToUInt32(hashValue.Hash, 0);
56         }
57 
58         public static string Get(string item)
59         {
60             var hashValue = ComputeHash(item);
61             var index = GetClockwiseNearestNode(hashValue);
62             return ConsistentHashNodes[_nodeKeys[index]];
63         }
64 
65         private static int GetClockwiseNearestNode(uint hash)
66         {
67             int begin = 0;
68             int end = _nodeKeys.Length - 1;
69 
70             if (_nodeKeys[end] < hash || _nodeKeys[0] > hash)
71             {
72                 return 0;
73             }
74 
75             while ((end - begin) > 1)
76             {
77                 var mid = (end + begin) / 2;
78                 if (_nodeKeys[mid] >= hash) end = mid;
79                 else begin = mid;
80             }
81 
82             return end;
83         }
84     }
85 }
View Code

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 由於谷歌翻譯官方API是付費版本,本著免費和開源的精神。分享一下用 Net Core 實現谷歌翻譯API的代碼。 項目引用的Nuget 包: ChakraCore.NET Newtonsoft.Json JavaScriptEngineSwitcher.ChakraCore.Native.win-x ...
  • 一.編寫併發布WebService服務 1.新建空web應用程式 2.右鍵項目解決方案-添加-新建項-選擇web服務 添加完成如下: 3.可以看到實例代碼里有這一行註釋,請取消註釋,因為我們要使用ajax來調用webservice // [System.Web.Script.Services.Scr ...
  • 公司項目最近出現獲取訪問功能變數名稱、埠、IP錯誤現象,通過排查發現, 之前項目一直通過Nginx自定義Headers信息來獲取,但最近運維人員失誤操作造成自定義Header信息丟失,造成項目拿不到對應的數據。思前想後,想找找官方有沒有關於此類問題通用標準化的解決方案。 一、Nginx配置如下: 二、.N ...
  • 登錄界面的搭建還是比較簡單的,雖然有點簡陋,但能用的姑且當做好的吧,如下圖: 這裡使用的是DevExpress控制項,其中值得一看的就是使用LayoutControl控制項來進行TextEdit控制項的佈局。對於一般幾個TextEdit併排的佈局而言,使用這個控制項的效果還是不錯的。 既然涉及到了系統的登錄 ...
  • FileUpload在HTML中是個常用的基礎控制項,在涉及到上傳各種格式的文件時候都會用到;筆者前段時間正好用到它做上傳功能,記錄下來做一些累積, 前端到後臺用的是的Jquery中的Ajax進行數據傳輸,在後臺的邏輯處理中以HttpPostedFileBase的對象調用SaveAs(ServerSa ...
  • C# 實體類轉json數據過濾掉欄位為null的欄位 語法如下: var jsonSetting = new JsonSerializerSettings {NullValueHandling = NullValueHandling.Ignore}; var json = JsonConvert.S ...
  • 上一篇我們用jenkins做了一個簡單的自動化發佈,在shell中採用的是 BUILD_ID=dontKillMe nohup dotnet xxx.dll & 這種簡單的後臺承載,如果你的業務 量相對比較小,可以用這個方法玩一玩,但存在二個問題:1. 無法對進程進行批量或者可視化管理。 2. 單機 ...
  • 1、新建ASP.NET Core Web應用程式 2、從NuGet下載安裝以下工具包 Microsoft.EntityFrameworkCore Microsoft.EntityFrameworkCore.SqlServer Microsoft.EntityFrameworkCore.Tools M ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...