【深入淺出 Yarn 架構與實現】3-2 Yarn Client 編寫

来源:https://www.cnblogs.com/shuofxz/archive/2022/11/17/16900685.html
-Advertisement-
Play Games

上篇文章介紹了編寫 Yarn Application 的整體框架流程,本篇文章將詳細介紹其中 Client 部分的編寫方式。 一、Yarn Client 編寫方法 本篇代碼已上傳 Github: Github - MyYarnClient 一)編寫流程 1、創建並啟動 Client YarnClie ...


上篇文章介紹了編寫 Yarn Application 的整體框架流程,本篇文章將詳細介紹其中 Client 部分的編寫方式。

一、Yarn Client 編寫方法

本篇代碼已上傳 Github:
Github - MyYarnClient

一)編寫流程

1、創建並啟動 Client

YarnClient 內容通過 ApplicationClientProtocol 與 ResourceManager 通信,向 RM 的ApplicationsManager 申請 Application。
跟蹤進去可以在 YarnClientImpl 找到 rpc:
this.rmClient = (ApplicationClientProtocol)ClientRMProxy.createRMProxy(this.getConfig(), ApplicationClientProtocol.class);

YarnClient yarnClient = YarnClient.createYarnClient();
yarnClient.init(conf);
yarnClient.start();

2、通過YarnClient 創建 Application

GetNewApplicationResponse 中除了包含 ApplicationId,還包括集群最大/最小資源,給任務啟動設置的資源作參考。

YarnClientApplication app = yarnClient.createApplication();
GetNewApplicationResponse appResponse = app.getNewApplicationResponse();

3、關鍵:完善 ApplicationSubmissionContext

需要在 ApplicationSubmissionContext 中定義 RM 啟動 AM 時所需的全部信息,主要包括:

  • app 信息:id,name
  • 隊列、優先順序信息
  • 提交用戶
  • ContainerLaunchContext:定義 AM 啟動所需信息
    • RECT
      • Resources (binaries, jars, files etc.):其中包括 Application master jar
      • Environment settings (CLASSPATH etc.)
      • Command to be executed
      • security Tokens
// 3 完善 ApplicationSubmissionContext 所需內容
ApplicationSubmissionContext appContext = app.getApplicationSubmissionContext();
ApplicationId applicationId = appContext.getApplicationId();

// 3.1 設置application name
appContext.setApplicationName("my-test-app");

// 3.2 設置ContainerLaunchContext
// localResources, env, commands 等
// application master 的 jar 放到 localResources 中
// 這部分較長省略,請到代碼中查看
ContainerLaunchContext amContainerCtx = createAMContainerLaunchContext(
        conf, app.getApplicationSubmissionContext().getApplicationId());
appContext.setAMContainerSpec(amContainerCtx);

// 3.3 設置優先順序
Priority pri = Priority.newInstance(0);
appContext.setPriority(pri);

// 3.4 設置隊列
appContext.setQueue("default");

// 3.5 設置 am 資源
int amMemory = 2048;
int amVCores = 2;
Resource capability = Resource.newInstance(amMemory, amVCores);
appContext.setResource(capability);

4、提交 Application

提交後,RM 接收到 Application,根據資源請求分配容器,最終將 AM 啟動在容器中。
這裡交給 YarnClientImpl 執行 rmClient.submitApplication(request),通過 RPC ApplicationClientProtocol 提交到 RM

ApplicationId appId = yarnClient.submitApplication(appContext);

5、獲取任務進度信息

ApplicationReport report = yarnClient.getApplicationReport(appId);
log.info("Got application report " + 
        ", clientToAMToken=" + report.getClientToAMToken() 
        + ", appDiagnostics=" + report.getDiagnostics() 
        + ", appMasterHost=" + report.getHost() 
        + ", appQueue=" + report.getQueue()
        + ", appMasterRpcPort=" + report.getRpcPort()
        + ", appStartTime=" + report.getStartTime()
        + ", yarnAppState=" + report.getYarnApplicationState().toString()
        + ", distributedFinalState=" + report.getFinalApplicationStatus().toString()
        + ", appTrackingUrl=" + report.getTrackingUrl()
        + ", appUser=" + report.getUser());

6、kill Application

當 Application 運行了過長的時間或者其他的原因,client 可以 kill application。
流程是:client 像 RM 發送 kill 信號,再傳遞給 AM

yarnClient.killApplication(appId);

二)涉及的通信協議

image.png


參考文章:
Hadoop: Writing YARN Applications - Writing a simple Client
《Hadoop 技術內幕 - 深入解析 Yarn 結構設計與實現原理》第四章


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 5.4 介面開發-根據id刪除附件 第2-1-2章 傳統方式安裝FastDFS-附FastDFS常用命令 第2-1-3章 docker-compose安裝FastDFS,實現文件存儲服務 第2-1-5章 docker安裝MinIO實現文件存儲服務-springboot整合minio-minio全網最 ...
  • 自己的客服系統做好了,官網頁面也有了,但是沒有介紹性的內容文章。網站被收錄的太少,這樣會導致網站的權重不高,搜索排名比較低。 因此要簡單的加上一個小型的內容管理功能。 設計資料庫 很簡單的兩張表,分類表和內容表 DROP TABLE IF EXISTS `cms_cate`; CREATE TABL ...
  • jdk線程池工作原理解析(二) 本篇博客是jdk線程池ThreadPoolExecutor工作原理解析系列博客的第二篇,在第一篇博客中從源碼層面分析了ThreadPoolExecutor在RUNNING狀態下處理任務的核心邏輯,而在這篇博客中將會詳細講解jdk線程池ThreadPoolExecuto ...
  • RabbitMQ 常見問題 昔我往矣,楊柳依依。今我來思,雨雪霏霏。 1、什麼是RabbitMQ? RabbitMQ是一款開源的、Erlang編寫的消息中間件;最大的特點就是消費並不需要確保提供方存在,實現了服務之間的高度解耦,可以用它來:解耦、非同步、削峰。 2、MQ的優點 非同步處理 - 相比於傳統 ...
  • 實現02 3.實現任務階段3-處理Servlet02 3.3Servlet規範設計 3.3.1MyServlet 該類模仿Servlet介面,為了簡化,只聲明瞭三個方法:init(),service(),destroy() package com.li.MyTomcat.servlet; impor ...
  • 通過創建數據表索引,有效提升系統性能。 一、問題背景 在11月10日下午5點,出現channel非同步下發消息隊列消息積壓報警,經排查分析是因為channel請求鑫某億服務商落單時間過長,導致了channel消費消息隊列的消息變慢的情況。所以,專項對鑫某億系統相關業務進行優化。 一(1)、現場 查看當 ...
  • 眾所周知,某度本身就是最大的爬蟲腳本,那麼純純的去某個網站找壁紙,還不如去某度圖片直接找,瞬間格局打開! 話不多說,直接用Python來開發一下此處資源! 開發環境 & 第三方模塊 環境 解釋器版本 >>> python 3.8 代碼編輯器 >>> pycharm 2021.2 模塊 request ...
  • Kafka 常見問題 一年將盡夜,萬里未歸人。 1、Kafka 簡介 Apache Kafka是一個分散式發佈 - 訂閱消息系統和一個強大的隊列, 可以處理大量的數據, 並使您能夠將消息從一個端點傳遞到另一個端點。 Kafka適合離線和線上消息消費,Kafka消息保留在磁碟上, 併在群集內複製以防止 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...