最好的重試是指數後退和抖動

来源:https://www.cnblogs.com/liululee/archive/2019/09/22/11569565.html
-Advertisement-
Play Games

1. 概述 在本教程中,我們將探討如何使用兩種不同的策略改進客戶端重試:指數後退和抖動。 2. 重試 在分散式系統中,多個組件之間的網路通信隨時可能發生故障。 客戶端應用程式通過實現重試來處理這些失敗。 設想我們有一個調用遠程服務的客戶端應用程式—— PingPongService 。 如果 Pin ...


1. 概述

在本教程中,我們將探討如何使用兩種不同的策略改進客戶端重試:指數後退和抖動。

2. 重試

在分散式系統中,多個組件之間的網路通信隨時可能發生故障。

客戶端應用程式通過實現重試來處理這些失敗。

設想我們有一個調用遠程服務的客戶端應用程式—— PingPongService

interface PingPongService {
    String call(String ping) throws PingPongServiceException;
}

如果 PingPongService 返回一個 PingPongServiceException ,則客戶端應用程式必須重試。在以下選項當中,我們將考慮實現客戶端重試的方法。

3. Resilience4j 重試

在我們的例子中,我們將使用 Resilience4j 庫,特別是它的 retry 模塊。我們需要將添加 resilience4j-retry 模塊到 pom.xml

<dependency>
    <groupId>io.github.resilience4j</groupId>
    <artifactId>resilience4j-retry</artifactId>
</dependency>

關於重試的複習,不要忘記查看我們的 Resilience4j 指南

4. 指數後退

客戶端應用程式必須負責地實現重試。當客戶在沒有等待的情況下重試失敗的調用時,他們可能會使系統不堪重負,並導致已經處於困境的服務進一步降級。

指數回退是處理失敗網路調用重試的常用策略。簡單地說,客戶端在連續重試之間等待的時間間隔越來越長:

wait_interval = base * multiplier^n

其中,

  • base 是初始間隔,即等待第一次重試
  • n 是已經發生的故障數量
  • multiplier 是一個任意的乘法器,可以用任何合適的值替換

通過這種方法,我們為系統提供了喘息的空間,以便從間歇性故障或更嚴重的問題中恢復過來。

我們可以在 Resilience4j 重試中使用指數回退演算法,方法是配置它的 IntervalFunction ,該函數接受 initialIntervalmultiplier

重試機制使用 IntervalFunction 作為睡眠函數:

IntervalFunction intervalFn =
  IntervalFunction.ofExponentialBackoff(INITIAL_INTERVAL, MULTIPLIER);

RetryConfig retryConfig = RetryConfig.custom()
  .maxAttempts(MAX_RETRIES)
  .intervalFunction(intervalFn)
  .build();
Retry retry = Retry.of("pingpong", retryConfig);

Function<String, String> pingPongFn = Retry
    .decorateFunction(retry, ping -> service.call(ping));
pingPongFn.apply("Hello");

讓我們模擬一個真實的場景,假設我們有幾個客戶端同時調用 PingPongService

ExecutorService executors = newFixedThreadPool(NUM_CONCURRENT_CLIENTS);
List<Callable> tasks = nCopies(NUM_CONCURRENT_CLIENTS, () -> pingPongFn.apply("Hello"));
executors.invokeAll(tasks);

讓我們看看 NUM_CONCURRENT_CLIENTS = 4 的遠程調用日誌:

[thread-1] At 00:37:42.756
[thread-2] At 00:37:42.756
[thread-3] At 00:37:42.756
[thread-4] At 00:37:42.756

[thread-2] At 00:37:43.802
[thread-4] At 00:37:43.802
[thread-1] At 00:37:43.802
[thread-3] At 00:37:43.802

[thread-2] At 00:37:45.803
[thread-1] At 00:37:45.803
[thread-4] At 00:37:45.803
[thread-3] At 00:37:45.803

[thread-2] At 00:37:49.808
[thread-3] At 00:37:49.808
[thread-4] At 00:37:49.808
[thread-1] At 00:37:49.808

我們可以在這裡看到一個清晰的模式——客戶機等待指數級增長的間隔,但是在每次重試(衝突)時,它們都在同一時間調用遠程服務。

img

我們只解決了問題的一部分 - 我們不再重新啟動遠程服務,但是,取而代之的是隨著時間的推移分散工作量,我們在工作時間間隔更多,空閑時間更長。此行為類似於驚群問題

5. 介紹抖動

在我們前面的方法中,客戶機等待時間逐漸變長,但仍然是同步的。添加抖動提供了一種方法來中斷跨客戶機的同步,從而避免衝突。在這種方法中,我們給等待間隔增加了隨機性。

wait_interval = (base * 2^n) +/- (random_interval)

其中,random_interval 被添加(或減去)以打破客戶端之間的同步。

我們不會深入研究隨機區間的電腦制,但是隨機化必須將峰值空間分離到更平滑的客戶端調用分佈。

我們可以通過配置一個指數隨機回退 IntervalFunction,它也接受一個 randomizationFactor,從而在 Resilience4j 重試中使用帶有抖動的指數回退:

IntervalFunction intervalFn = 
  IntervalFunction.ofExponentialRandomBackoff(INITIAL_INTERVAL, MULTIPLIER, RANDOMIZATION_FACTOR);

讓我們回到我們的真實場景,並查看帶抖動的遠程調用日誌:

[thread-2] At 39:21.297
[thread-4] At 39:21.297
[thread-3] At 39:21.297
[thread-1] At 39:21.297

[thread-2] At 39:21.918
[thread-3] At 39:21.868
[thread-4] At 39:22.011
[thread-1] At 39:22.184

[thread-1] At 39:23.086
[thread-5] At 39:23.939
[thread-3] At 39:24.152
[thread-4] At 39:24.977

[thread-3] At 39:26.861
[thread-1] At 39:28.617
[thread-4] At 39:28.942
[thread-2] At 39:31.039

現在我們有了更好的傳播。我們已經消除了衝突和空閑時間,並以幾乎恆定的客戶端調用率結束,除非出現最初的激增。

img

註意:我們誇大了插圖的間隔時間,在實際情況中,我們會有較小的差距。

6. 結論

在本教程中,我們探討瞭如何通過使用抖動增加指數回退來改進客戶端應用程式重試失敗調用的方法。本教程中使用的示例的源代碼可以在 GitHub 上找到。

原文:https://www.baeldung.com/resilience4j-backoff-jitter

作者:Priyank Srivastava

譯者:Queena

9月福利,關註公眾號

後臺回覆:004,領取8月翻譯集錦!

往期福利回覆:001,002, 003即可領取!

img


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近將萬方數據的爬取代碼進行了重構,速度大概有10w每小時吧,因為屬於公司項目,代碼暫時就不開源了,所以在這裡先說說思路和一些註意事項吧,順帶吐槽一下萬方。 先上圖: 其實邏輯也蠻簡單的,醫學類的期刊分了16個大類,那麼首先手動將這16大類所對應的唯一id拿下來拼接出該類型的url,然後翻頁請求它就 ...
  • 函數概述 qsort 為quick sort的簡寫,意為快速排序,主要用於對各種數組的排序,在頭文件stdlib.h中。 因為數組的元素可能是任何類型的,甚至是結構或者聯合,所以必須高數函數qsort如何確定兩個數組元素哪一個“更小”,這就需要我們給出比較的規則,即什麼算大,什麼算小。 通過編寫比較 ...
  • 在 Spring Cloud 微服務系統中,一種常見的負載均衡方式是,客戶端的請求首先經過負載均衡(Ngnix),再到達服務網關(Zuul 集群),然後再到具體的服務。服務統一註冊到高可用的服務註冊中心集群,服務的所有的配置文件由配置服務管理,配置服務的配置文件放在 GIT 倉庫,方便開發人員隨時改 ...
  • 前言 越來越多的項目已經使用 "Java 8" 了,毫無疑問, "Java 8" 是Java自Java 5(發佈於2004年)之後的最重要的版本。這個版本包含語言、編譯器、庫、工具和 JVM 等方面的十多個新特性。在本文中我們將學習這些新特性,並用實際的例子說明在什麼場景下適合使用。 引用: 本文參 ...
  • R語言構建蛋白質網路並實現GN演算法 1.蛋白質網路的構建 我們使用與人類HIV相關的蛋白質互作數據hunam HIV PPI.csv來構建這個蛋白質互作網路。 在R中,我們可以從存儲在R環境外部的文件讀取數據。還可以將數據寫入由操作系統存儲和訪問的文件。 R可以讀取和寫入各種文件格式,如:csv,e ...
  • 面試題 如何保證消息的順序性? 面試官心理分析 其實這個也是用 MQ 的時候必問的話題,第一看看你了不瞭解順序這個事兒?第二看看你有沒有辦法保證消息是有順序的?這是生產系統中常見的問題。 面試題剖析 我舉個例子,我們以前做過一個 mysql 同步的系統,壓力還是非常大的,日同步數據要達到上億,就是說 ...
  • 發現模塊和集群的形成 目標 發現節點 Master選舉 組成集群,在Master信息發生變化時及時更新。 故障檢測 細分為幾個子模塊 Discovery發現模塊 Discover是在集群Master節點未知時,互相發現對方的過程,例如新節點的加入或是先前的主節點宕機,如果一個節點不滿足Master資 ...
  • JConsole(可視化工具) 運行 JConsole記憶體監控 測試代碼 這裡看到我們有倆個線程。 JPS(JVM Process status) JPS是使用的頻率最高的工具,和linux下的ps命令差不多(把J去掉就是一個ps)。 因為我這裡開啟了一個eclipse,所以運行結果如下所示: 如果 ...
一周排行
    -Advertisement-
    Play Games
  • C#TMS系統代碼-基礎頁面BaseCity學習 本人純新手,剛進公司跟領導報道,我說我是java全棧,他問我會不會C#,我說大學學過,他說這個TMS系統就給你來管了。外包已經把代碼給我了,這幾天先把增刪改查的代碼背一下,說不定後面就要趕鴨子上架了 Service頁面 //using => impo ...
  • 委托與事件 委托 委托的定義 委托是C#中的一種類型,用於存儲對方法的引用。它允許將方法作為參數傳遞給其他方法,實現回調、事件處理和動態調用等功能。通俗來講,就是委托包含方法的記憶體地址,方法匹配與委托相同的簽名,因此通過使用正確的參數類型來調用方法。 委托的特性 引用方法:委托允許存儲對方法的引用, ...
  • 前言 這幾天閑來沒事看看ABP vNext的文檔和源碼,關於關於依賴註入(屬性註入)這塊兒產生了興趣。 我們都知道。Volo.ABP 依賴註入容器使用了第三方組件Autofac實現的。有三種註入方式,構造函數註入和方法註入和屬性註入。 ABP的屬性註入原則參考如下: 這時候我就開始疑惑了,因為我知道 ...
  • C#TMS系統代碼-業務頁面ShippingNotice學習 學一個業務頁面,ok,領導開完會就被裁掉了,很突然啊,他收拾東西的時候我還以為他要旅游提前請假了,還在尋思為什麼回家連自己買的幾箱飲料都要叫跑腿帶走,怕被偷嗎?還好我在他開會之前拿了兩瓶芬達 感覺感覺前面的BaseCity差不太多,這邊的 ...
  • 概述:在C#中,通過`Expression`類、`AndAlso`和`OrElse`方法可組合兩個`Expression<Func<T, bool>>`,實現多條件動態查詢。通過創建表達式樹,可輕鬆構建複雜的查詢條件。 在C#中,可以使用AndAlso和OrElse方法組合兩個Expression< ...
  • 閑來無聊在我的Biwen.QuickApi中實現一下極簡的事件匯流排,其實代碼還是蠻簡單的,對於初學者可能有些幫助 就貼出來,有什麼不足的地方也歡迎板磚交流~ 首先定義一個事件約定的空介面 public interface IEvent{} 然後定義事件訂閱者介面 public interface I ...
  • 1. 案例 成某三甲醫預約系統, 該項目在2024年初進行上線測試,在正常運行了兩天後,業務系統報錯:The connection pool has been exhausted, either raise MaxPoolSize (currently 800) or Timeout (curren ...
  • 背景 我們有些工具在 Web 版中已經有了很好的實踐,而在 WPF 中重新開發也是一種費時費力的操作,那麼直接集成則是最省事省力的方法了。 思路解釋 為什麼要使用 WPF?莫問為什麼,老 C# 開發的堅持,另外因為 Windows 上已經裝了 Webview2/edge 整體打包比 electron ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...