限流的幾種方案

来源:https://www.cnblogs.com/tyson03/archive/2023/03/30/17271077.html
-Advertisement-
Play Games

文章目錄 限流基本概念 QPS和連接數控制 傳輸速率 黑白名單 分散式環境 限流方案常用演算法 令牌桶演算法 漏桶演算法 滑動視窗 常用的限流方案 Nginx限流 中間件限流 限流組件 合法性驗證限流 Guava限流 網關層限流 從架構維度考慮限流設計 具體的實現限流的手段: Tomcat限流 限流基本概 ...


文章目錄

  • 限流基本概念

    • QPS和連接數控制
    • 傳輸速率
    • 黑白名單
    • 分散式環境
  • 限流方案常用演算法

    • 令牌桶演算法
    • 漏桶演算法
    • 滑動視窗
  • 常用的限流方案

    • Nginx限流
    • 中間件限流
    • 限流組件
    • 合法性驗證限流
    • Guava限流
    • 網關層限流
  • 從架構維度考慮限流設計

  • 具體的實現限流的手段:

    • Tomcat限流

限流基本概念

對一般的限流場景來說它具有兩個維度的信息:

  • 時間 限流基於某段時間範圍或者某個時間點,也就是我們常說的“時間視窗”,比如對每分鐘、每秒鐘的時間視窗做限定
  • 資源 基於可用資源的限制,比如設定最大訪問次數,或最高可用連接數

上面兩個維度結合起來看,限流就是在某個時間視窗對資源訪問做限制,比如設定每秒最多100個訪問請求。但在真正的場景里,我們不止設置一種限流規則,而是會設置多個限流規則共同作用,主要的幾種限流規則如下:

QPS和連接數控制

對於連接數和QPS)限流來說,我們可設定IP維度的限流,也可以設置基於單個伺服器的限流。

在真實環境中通常會設置多個維度的限流規則,比如設定同一個IP每秒訪問頻率小於10,連接數小於5,再設定每台機器QPS最高1000,連接數最大保持200。更進一步,我們可以把某個伺服器組或整個機房的伺服器當做一個整體,設置更high-level的限流規則,這些所有限流規則都會共同作用於流量控制。

最全面的Java面試網站

傳輸速率

對於“傳輸速率”大家都不會陌生,比如資源的下載速度。有的網站在這方面的限流邏輯做的更細緻,比如普通註冊用戶下載速度為100k/s,購買會員後是10M/s,這背後就是基於用戶組或者用戶標簽的限流邏輯。

黑白名單

黑白名單是各個大型企業應用里很常見的限流和放行手段,而且黑白名單往往是動態變化的。舉個例子,如果某個IP在一段時間的訪問次數過於頻繁,被系統識別為機器人用戶或流量攻擊,那麼這個IP就會被加入到黑名單,從而限制其對系統資源的訪問,這就是我們俗稱的“封IP”。

我們平時見到的爬蟲程式,比如說爬知乎上的美女圖片,或者爬券商系統的股票分時信息,這類爬蟲程式都必須實現更換IP的功能,以防被加入黑名單。

有時我們還會發現公司的網路無法訪問12306這類大型公共網站,這也是因為某些公司的出網IP是同一個地址,因此在訪問量過高的情況下,這個IP地址就被對方系統識別,進而被添加到了黑名單。使用家庭寬頻的同學們應該知道,大部分網路運營商都會將用戶分配到不同出網IP段,或者時不時動態更換用戶的IP地址。

白名單就更好理解了,相當於御賜金牌在身,可以自由穿梭在各種限流規則里,暢行無阻。比如某些電商公司會將超大賣家的賬號加入白名單,因為這類賣家往往有自己的一套運維繫統,需要對接公司的IT系統做大量的商品發佈、補貨等等操作。

分散式環境

分散式區別於單機限流的場景,它把整個分散式環境中所有伺服器當做一個整體來考量。比如說針對IP的限流,我們限制了1個IP每秒最多10個訪問,不管來自這個IP的請求落在了哪台機器上,只要是訪問了集群中的服務節點,那麼都會受到限流規則的制約。

我們最好將限流信息保存在一個“中心化”的組件上,這樣它就可以獲取到集群中所有機器的訪問狀態,目前有兩個比較主流的限流方案:

  • 網關層限流 將限流規則應用在所有流量的入口處
  • 中間件限流 將限流信息存儲在分散式環境中某個中間件里(比如Redis緩存),每個組件都可以從這裡獲取到當前時刻的流量統計,從而決定是拒絕服務還是放行流量
  • sentinel,springcloud生態圈為微服務量身打造的一款用於分散式限流、熔斷降級等組件

限流方案常用演算法

令牌桶演算法

Token Bucket令牌桶演算法是目前應用最為廣泛的限流演算法,顧名思義,它有以下兩個關鍵角色:

  • 令牌 獲取到令牌的Request才會被處理,其他Requests要麼排隊要麼被直接丟棄
  • 桶 用來裝令牌的地方,所有Request都從這個桶裡面獲取令牌 主要涉及到2個過程:
  • 令牌生成

這個流程涉及到令牌生成器和令牌桶,前面我們提到過令牌桶是一個裝令牌的地方,既然是個桶那麼必然有一個容量,也就是說令牌桶所能容納的令牌數量是一個固定的數值。

對於令牌生成器來說,它會根據一個預定的速率向桶中添加令牌,比如我們可以配置讓它以每秒100個請求的速率發放令牌,或者每分鐘50個。註意這裡的發放速度是勻速,也就是說這50個令牌並非是在每個時間視窗剛開始的時候一次性發放,而是會在這個時間視窗內勻速發放。

在令牌發放器就是一個水龍頭,假如在下麵接水的桶子滿了,那麼自然這個水(令牌)就流到了外面。在令牌發放過程中也一樣,令牌桶的容量是有限的,如果當前已經放滿了額定容量的令牌,那麼新來的令牌就會被丟棄掉。

本文已經收錄到Github倉庫,該倉庫包含電腦基礎、Java基礎、多線程、JVM、資料庫、Redis、Spring、Mybatis、SpringMVC、SpringBoot、分散式、微服務、設計模式、架構、校招社招分享等核心知識點,歡迎star~

Github地址

如果訪問不了Github,可以訪問gitee地址。

gitee地址

  • 令牌獲取

每個訪問請求到來後,必須獲取到一個令牌才能執行後面的邏輯。假如令牌的數量少,而訪問請求較多的情況下,一部分請求自然無法獲取到令牌,那麼這個時候我們可以設置一個“緩衝隊列”來暫存這些多餘的令牌。

緩衝隊列其實是一個可選的選項,並不是所有應用了令牌桶演算法的程式都會實現隊列。當有緩存隊列存在的情況下,那些暫時沒有獲取到令牌的請求將被放到這個隊列中排隊,直到新的令牌產生後,再從隊列頭部拿出一個請求來匹配令牌。

當隊列已滿的情況下,這部分訪問請求將被丟棄。在實際應用中我們還可以給這個隊列加一系列的特效,比如設置隊列中請求的存活時間,或者將隊列改造為PriorityQueue,根據某種優先順序排序,而不是先進先出。

漏桶演算法

Leaky Bucket,又是個桶,限流演算法是跟桶杠上了,那麼漏桶和令牌桶有什麼不同呢,

漏桶演算法的前半段和令牌桶類似,但是操作的對象不同,令牌桶是將令牌放入桶里,而漏桶是將訪問請求的數據包放到桶里。同樣的是,如果桶滿了,那麼後面新來的數據包將被丟棄。

漏桶演算法的後半程是有鮮明特色的,它永遠只會以一個恆定的速率將數據包從桶內流出。打個比方,如果我設置了漏桶可以存放100個數據包,然後流出速度是1s一個,那麼不管數據包以什麼速率流入桶里,也不管桶里有多少數據包,漏桶能保證這些數據包永遠以1s一個的恆定速度被處理。

  • 漏桶 vs 令牌桶的區別

根據它們各自的特點不難看出來,這兩種演算法都有一個“恆定”的速率和“不定”的速率。令牌桶是以恆定速率創建令牌,但是訪問請求獲取令牌的速率“不定”,反正有多少令牌發多少,令牌沒了就乾等。而漏桶是以“恆定”的速率處理請求,但是這些請求流入桶的速率是“不定”的。

從這兩個特點來說,漏桶的天然特性決定了它不會發生突發流量,就算每秒1000個請求到來,那麼它對後臺服務輸出的訪問速率永遠恆定。而令牌桶則不同,其特性可以“預存”一定量的令牌,因此在應對突發流量的時候可以在短時間消耗所有令牌,其突發流量處理效率會比漏桶高,但是導向後臺系統的壓力也會相應增多。

滑動視窗

比如說,我們在每一秒內有5個用戶訪問,第5秒內有10個用戶訪問,那麼在0到5秒這個時間視窗內訪問量就是15。如果我們的介面設置了時間視窗內訪問上限是20,那麼當時間到第六秒的時候,這個時間視窗內的計數總和就變成了10,因為1秒的格子已經退出了時間視窗,因此在第六秒內可以接收的訪問量就是20-10=10個。

滑動視窗其實也是一種計算器演算法,它有一個顯著特點,當時間視窗的跨度越長時,限流效果就越平滑。打個比方,如果當前時間視窗只有兩秒,而訪問請求全部集中在第一秒的時候,當時間向後滑動一秒後,當前視窗的計數量將發生較大的變化,拉長時間視窗可以降低這種情況的發生概率

常用的限流方案

合法性驗證限流

比如驗證碼、IP 黑名單等,這些手段可以有效的防止惡意攻擊和爬蟲採集;

Guawa限流

在限流領域中,Guava在其多線程模塊下提供了以RateLimiter為首的幾個限流支持類,但是作用範圍僅限於“當前”這台伺服器,也就是說Guawa的限流是單機的限流,跨了機器或者jvm進程就無能為力了 比如說,目前我有2台伺服器[Server 1Server 2],這兩台伺服器都部署了一個登陸服務,假如我希望對這兩台機器的流量進行控制,比如將兩台機器的訪問量總和控制在每秒20以內,如果用Guava來做,只能獨立控制每台機器的訪問量<=10。

儘管Guava不是面對分散式系統的解決方案,但是其作為一個簡單輕量級的客戶端限流組件,非常適合來講解限流演算法

網關層限流

服務網關,作為整個分散式鏈路中的第一道關卡,承接了所有用戶來訪請求,因此在網關層面進行限流是一個很好的切入點 上到下的路徑依次是:

  1. 用戶流量從網關層轉發到後臺服務
  2. 後臺服務承接流量,調用緩存獲取數據
  3. 緩存中無數據,則訪問資料庫

流量自上而下是逐層遞減的,在網關層聚集了最多最密集的用戶訪問請求,其次是後臺服務。

然後經過後臺服務的驗證邏輯之後,刷掉了一部分錯誤請求,剩下的請求落在緩存上,如果緩存中沒有數據才會請求漏斗最下方的資料庫,因此資料庫層面請求數量最小(相比較其他組件來說資料庫往往是併發量能力最差的一環,阿裡系的MySQL即便經過了大量改造,單機併發量也無法和Redis、Kafka之類的組件相比)

目前主流的網關層有以軟體為代表的Nginx,還有Spring Cloud中的Gateway和Zuul這類網關層組件

Nginx限流

在系統架構中,Nginx的代理與路由轉發是其作為網關層的一個很重要的功能,由於Nginx天生的輕量級和優秀的設計,讓它成為眾多公司的首選,Nginx從網關這一層面考慮,可以作為最前置的網關,抵擋大部分的網路流量,因此使用Nginx進行限流也是一個很好的選擇,在Nginx中,也提供了常用的基於限流相關的策略配置.

Nginx 提供了兩種限流方法:一種是控制速率,另一種是控制併發連接數。

控制速率

我們需要使用 limit_req_zone 用來限制單位時間內的請求數,即速率限制,

因為Nginx的限流統計是基於毫秒的,我們設置的速度是 2r/s,轉換一下就是500毫秒內單個IP只允許通過1個請求,從501ms開始才允許通過第2個請求。

  • 控制速率優化版

上面的速率控制雖然很精準但是在生產環境未免太苛刻了,實際情況下我們應該控制一個IP單位總時間內的總訪問次數,而不是像上面那樣精確到毫秒,我們可以使用 burst 關鍵字開啟此設置

burst=4意思是每個IP最多允許4個突發請求

控制併發數

利用 limit_conn_zonelimit_conn 兩個指令即可控制併發數

其中 limit_conn perip 10 表示限制單個 IP 同時最多能持有 10 個連接;limit_conn perserver 100 表示 server 同時能處理併發連接的總數為 100 個。

註意:只有當 request header 被後端處理後,這個連接才進行計數。

中間件限流

對於分散式環境來說,無非是需要一個類似中心節點的地方存儲限流數據。打個比方,如果我希望控制介面的訪問速率為每秒100個請求,那麼我就需要將當前1s內已經接收到的請求的數量保存在某個地方,並且可以讓集群環境中所有節點都能訪問。那我們可以用什麼技術來存儲這個臨時數據呢?

那麼想必大家都能想到,必然是redis了,利用Redis過期時間特性,我們可以輕鬆設置限流的時間跨度(比如每秒10個請求,或者每10秒10個請求)。同時Redis還有一個特殊技能–腳本編程,我們可以將限流邏輯編寫成一段腳本植入到Redis中,這樣就將限流的重任從服務層完全剝離出來,同時Redis強大的併發量特性以及高可用集群架構也可以很好的支持龐大集群的限流訪問。【reids + lua】

限流組件

除了上面介紹的幾種方式以外,目前也有一些開源組件提供了類似的功能,比如Sentinel就是一個不錯的選擇。Sentinel是阿裡出品的開源組件,並且包含在了Spring Cloud Alibaba組件庫中,Sentinel提供了相當豐富的用於限流的API以及可視化管控台,可以很方便的幫助我們對限流進行治理

從架構維度考慮限流設計

在真實的項目里,不會只使用一種限流手段,往往是幾種方式互相搭配使用,讓限流策略有一種層次感,達到資源的最大使用率。在這個過程中,限流策略的設計也可以參考前面提到的漏斗模型,上寬下緊,漏斗不同部位的限流方案設計要儘量關註當前組件的高可用。

以我參與的實際項目為例,比如說我們研發了一個商品詳情頁的介面,通過手機淘寶導流,app端的訪問請求首先會經過阿裡的mtop網關,在網關層我們的限流會做的比較寬鬆,等到請求通過網關抵達後臺的商品詳情頁服務之後,再利用一系列的中間件+限流組件,對服務進行更加細緻的限流控制

具體的實現限流的手段

1)Tomcat 使用 maxThreads來實現限流。

2)Nginx的limit_req_zone和 burst來實現速率限流。

3)Nginx的limit_conn_zonelimit_conn兩個指令控制併發連接的總數。

4)時間視窗演算法藉助 Redis的有序集合可以實現。

5)漏桶演算法可以使用Redis-Cell來實現。

6)令牌演算法可以解決Google的guava包來實現。

需要註意的是藉助Redis實現的限流方案可用於分散式系統,而guava實現的限流只能應用於單機環境。如果你覺得伺服器端限流麻煩,可以在不改任何代碼的情況下直接使用容器限流(Nginx或Tomcat),但前提是能滿足項目中的業務需求。

Tomcat限流

Tomcat 8.5 版本的最大線程數在 conf/server.xml 配置中,maxThreads 就是 Tomcat 的最大線程數,當請求的併發大於此值(maxThreads)時,請求就會排隊執行,這樣就完成了限流的目的。

註意:

maxThreads 的值可以適當的調大一些,Tomcat預設為 150(Tomcat 版本 8.5),但這個值也不是越大越好,要看具體的伺服器配置,需要註意的是每開啟一個線程需要耗用 1MB 的 JVM 記憶體空間用於作為線程棧之用,並且線程越多 GC 的負擔也越重。

最後需要註意一下,操作系統對於進程中的線程數有一定的限制,Windows 每個進程中的線程數不允許超過 2000,Linux 每個進程中的線程數不允許超過 1000。

最後給大家分享一個Github倉庫,上面有大彬整理的300多本經典的電腦書籍PDF,包括C語言、C++、Java、Python、前端、資料庫、操作系統、電腦網路、數據結構和演算法、機器學習、編程人生等,可以star一下,下次找書直接在上面搜索,倉庫持續更新中~

Github地址


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在上篇隨筆《基於Admin.NET框架的前端的一些改進和代碼生成處理(1)》中大致介紹了一些關於對Admin.NET框架的前端的改造工作,主要目的就是希望能夠增加代碼的簡潔和可讀性,以及利用代碼生成工具來快速生成相關的代碼,從而減少開發過程中的繁瑣問題。本篇隨筆繼續探討一下,對其中一些模塊功能進行一... ...
  • Array --JavaScript內置對象 描述 可以用一個變數存儲多種數據類型的Array對象,Array不是關聯數組,不能使用字元串作為索引訪問數組元素,需要使用非負整數的下標訪問數組中的元素。 和對象的某些特征很相似,例如:屬性訪問器一半相似,衍生出的使用 .call() 或者 .apply ...
  • 享元模式(Flyweight Pattern):是一種用於優化對象創建和管理的設計模式。它旨在減少記憶體消耗和提高性能,通過共用具有相同狀態的對象來實現這一目標。 具體來說,享元模式涉及兩個主要的對象:享元工廠和具有共用狀態的享元對象。享元工廠負責創建和管理共用對象,以確保每個對象只被創建一次。享元對 ...
  • 上一篇文章我們介紹了 Vue2模版編譯原理,這一章我們的目標是弄清楚模版 template和響應式數據是如何渲染成最終的DOM。數據更新驅動視圖變化這部分後期會單獨講解 我們先看一下模版和響應式數據是如何渲染成最終DOM 的流程 Vue初始化 new Vue發生了什麼 Vue入口構造函數 funct ...
  • 定義 觀察者模式屬於行為型模式,它定義了對象間的一種一對多的依賴關係,當一個對象的狀態發生改變時,所有依賴於它的對象都將得到通知,並自動更新。 一種一對多的關係中一稱為被觀察者也叫目標對象Subject而多則稱為觀察者對象Observer 觀察者模式中通常有兩個模型,一個觀察者(observer)和 ...
  • UML 類圖 1 類圖的結構 用動物園的類圖結構來舉例,先抽象化動物類如圖所示: 一個類圖包括類名、屬性和行為,類名不用解釋,在介紹屬性和行為前,先瞭解一下訪問許可權: ‘ - ’ private:只有類內部的成員才能訪問 ‘ + ’ public:類內部和類外部都能訪問 ‘ # ’ protecte ...
  • XSS攻擊是什麼? XSS攻擊是指攻擊者利用網站中的漏洞,向頁面中註入惡意腳本,從而獲取用戶的信息或者控制用戶的電腦。 舉一個通俗的例子,早期使用JSP頁面渲染頁面的項目,如果將用戶名改成nick<alert>1</alert>,則當用戶打開頁面時,就會彈出一個警告框,而這個警告框可以被惡意腳本所 ...
  • 使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。本篇介紹 VLD 配置文件中配置項 SkipHeapFreeLeaks 的使用方法。 ...
一周排行
    -Advertisement-
    Play Games
  • GoF之工廠模式 @目錄GoF之工廠模式每博一文案1. 簡單說明“23種設計模式”1.2 介紹工廠模式的三種形態1.3 簡單工廠模式(靜態工廠模式)1.3.1 簡單工廠模式的優缺點:1.4 工廠方法模式1.4.1 工廠方法模式的優缺點:1.5 抽象工廠模式1.6 抽象工廠模式的優缺點:2. 總結:3 ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 本章將和大家分享ES的數據同步方案和ES集群相關知識。廢話不多說,下麵我們直接進入主題。 一、ES數據同步 1、數據同步問題 Elasticsearch中的酒店數據來自於mysql資料庫,因此mysql數據發生改變時,Elasticsearch也必須跟著改變,這個就是Elasticsearch與my ...
  • 引言 在我們之前的文章中介紹過使用Bogus生成模擬測試數據,今天來講解一下功能更加強大自動生成測試數據的工具的庫"AutoFixture"。 什麼是AutoFixture? AutoFixture 是一個針對 .NET 的開源庫,旨在最大程度地減少單元測試中的“安排(Arrange)”階段,以提高 ...
  • 經過前面幾個部分學習,相信學過的同學已經能夠掌握 .NET Emit 這種中間語言,並能使得它來編寫一些應用,以提高程式的性能。隨著 IL 指令篇的結束,本系列也已經接近尾聲,在這接近結束的最後,會提供幾個可供直接使用的示例,以供大伙分析或使用在項目中。 ...
  • 當從不同來源導入Excel數據時,可能存在重覆的記錄。為了確保數據的準確性,通常需要刪除這些重覆的行。手動查找並刪除可能會非常耗費時間,而通過編程腳本則可以實現在短時間內處理大量數據。本文將提供一個使用C# 快速查找並刪除Excel重覆項的免費解決方案。 以下是實現步驟: 1. 首先安裝免費.NET ...
  • C++ 異常處理 C++ 異常處理機制允許程式在運行時處理錯誤或意外情況。它提供了捕獲和處理錯誤的一種結構化方式,使程式更加健壯和可靠。 異常處理的基本概念: 異常: 程式在運行時發生的錯誤或意外情況。 拋出異常: 使用 throw 關鍵字將異常傳遞給調用堆棧。 捕獲異常: 使用 try-catch ...
  • 優秀且經驗豐富的Java開發人員的特征之一是對API的廣泛瞭解,包括JDK和第三方庫。 我花了很多時間來學習API,尤其是在閱讀了Effective Java 3rd Edition之後 ,Joshua Bloch建議在Java 3rd Edition中使用現有的API進行開發,而不是為常見的東西編 ...
  • 框架 · 使用laravel框架,原因:tp的框架路由和orm沒有laravel好用 · 使用強制路由,方便介面多時,分多版本,分文件夾等操作 介面 · 介面開發註意欄位類型,欄位是int,查詢成功失敗都要返回int(對接java等強類型語言方便) · 查詢介面用GET、其他用POST 代碼 · 所 ...
  • 正文 下午找企業的人去鎮上做貸後。 車上聽同事跟那個司機對罵,火星子都快出來了。司機跟那同事更熟一些,連我在內一共就三個人,同事那一手指桑罵槐給我都聽愣了。司機也是老社會人了,馬上聽出來了,為那個無辜的企業經辦人辯護,實際上是為自己辯護。 “這個事情你不能怪企業。”“但他們總不能讓銀行的人全權負責, ...