初步探索GraalVM——雲原生時代JVM黑科技

来源:https://www.cnblogs.com/Jcloud/archive/2022/11/17/16898539.html
-Advertisement-
Play Games

1 雲原生時代Java語言的困境 經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。 雲原生時代,J ...


1 雲原生時代Java語言的困境

經過多年的演進,Java語言的功能和性能都在不斷的發展和提高,諸如即時編譯器、垃圾回收器等系統都能體現Java語言的優秀,但是想要享受這些功能帶來的提升都需要一段時間的運行來達到最佳性能,總的來說Java是面向大規模、長時間使用的服務端應用而設計的。

雲原生時代,Java語言一次編譯到處運行的優勢不復存在,理論上使用容器化技術,所有語言都能部署上雲,而無法脫離JVM的Java應用往往要面對JDK記憶體占用比應用本身還大的窘境;Java動態載入、卸載的特性也使得構建的應用鏡像中有一半以上的無用代碼和依賴這些都使得Java應用占用記憶體相當多。而啟動時間長,性能達到峰值的時間長使得在Serverless等場景下無法與Go、Node.js等快速語言競爭。

Java應用程式的運行生命周期示意圖

2 GraalVM

面對雲原生時代Java的不適,GraalVM或許是最好的解藥。GraalVM是Oracle實驗室推出的基於Java開發的開源高性能多語言運行時平臺,它既可以在傳統的 OpenJDK 上運行,也可以通過 AOT(Ahead-Of-Time)編譯成可執行文件單獨運行,甚至可以集成至資料庫中運行。除此之外,它還移除了編程語言之間的邊界,並且支持通過即時編譯技術,將混雜了不同的編程語言的代碼編譯到同一段二進位碼之中,從而實現不同語言之間的無縫切換。

 

本文主要簡單從三個方面介紹GraalVM可以為我們帶來的改變:

1)基於Java的Graal Compiler的出現對學習和研究虛擬機代碼編譯技術有著不可估量的價值,相比C++編寫的複雜無比的服務端編譯器,不管是對編譯器的優化還是學習的成本都大大的降低。
2)靜態編譯框架Substrate VM框架,為Java在雲原生時代提供了與其他語言競爭的可能,大大的減少了Java應用占用記憶體,並且可以加快啟動速度幾十倍。

 

3)以Truffle和Sulong為代表的中間語言解釋器,開發者可以使用Truffle提供的API快速用Java實現一種語言的解釋器,從而實現了在JVM平臺上運行其他語言的效果,為Java世界帶來了更多更有想象力的可能性。

GraalVM多語言支持

3 GraalVM整體結構

graal
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── SECURITY.md
├── THIRD_PARTY_LICENSE.txt
├── bench-common.libsonnet
├── ci-resources.libsonnet
├── ci.hocon
├── ci.jsonnet
├── ci_includes
├── common-utils.libsonnet
├── common.hocon
├── common.json
├── common.jsonnet
├── compiler
├── docs
├── espresso
├── graal-common.json
├── java-benchmarks
├── regex
├── repo-configuration.libsonnet
├── sdk
├── substratevm
├── sulong
├── tools
├── truffle
├── vm
└── wasm

3.1 Compiler

Compiler子項目全稱GraalVM編譯器,是用Java語言編寫的Java編譯器。高編譯效率、高輸出質量、同時支持提前編譯(AOT)和即時編譯(JIT)、同時支持應用於包括HotSpot在內的不同虛擬機的編譯器。

與C2採用一樣的中間表示形式(Sea of Nodes IR),後端優化上直接繼承了大量來自於HotSpot的服務端編譯器的高質量優化技術,是現在高校、研究院和企業編譯研究實踐的主要平臺。

Graal Compiler是GraalVM與HotSpotVM(從JDK10起)共同擁有的服務端即時編譯器,是C2編譯器未來的替代者。為了讓 Java 虛擬機與編譯器解耦,ORACLE引入了Java-Level JVM Compiler Interface(JVMCI)Jep 243 :把編譯器從虛擬機中抽離出來,並且可以通過介面與虛擬機交流(https://openjdk.java.net/jeps/243)

 

具體來說,即時編譯器與 Java 虛擬機的交互可以分為如下三個方面。

  1. 響應編譯請求;
  2. 獲取編譯所需的元數據(如類、方法、欄位)和反映程式執行狀態的 profile;
  3. 將生成的二進位碼部署至代碼緩存(code cache)里。

 

 

 


oracle提供的編譯時間差異示例

3.2 Substrate VM

Substrate VM提供了將Java程式靜態編譯為本地代碼的編譯工具鏈,包括了編譯框架、靜態分析工具、C++支持框架及運行時支持等。在程式運行前便將位元組碼轉換為機器碼

優點:

  1. 從指定的編譯入口開始靜態可達性分析,有效的控制了編譯範圍,解決了代碼膨脹的問題;
  2. 實現了多種運行時優化例如:傳統的java類是在第一次被用到時初始化的,之後每次調用時還要再檢查是否初始化過,GraalVM將其優化為在編譯時初始化;
  3. 無需在運行過程中耗費CPU資源來進行即時編譯,而程式也能在啟動一開始就達到理想的性能;

缺點:

  1. 靜態分析是資源密集型計算,需要消耗大量CPU、記憶體和時間;
  2. 靜態分析對反射、JNI、動態代理的分析能力非常有限,目前GraalVM只能通過額外配置的方式加以解決;
  3. Java序列化也有多項違反封閉性假設的動態特性:反射,JNI,動態類載入,目前GraalVM也需要通過額外配置解決,且不能處理所有序列化,例如Lambda對象的序列化,而且性能是JDK的一半;

 

 


啟動時長對比

 


占用記憶體對比

3.3 Truffle

我們知道一般編譯器分為前端和後端,前端負責詞法分析、語法分析、類型檢查和中間代碼生成,後端負責編譯優化和目標代碼生成。一種比較取巧的做法是將新語言編譯成某種已知語言,如Scala、Kotlin可以編譯成Java位元組碼,這樣就可以直接享用JVM的JIT、GC等各項優化,這種做法都是針對的編譯型語言。與之相對的,如JavaScript、Ruby、R、Python等解釋型語言,它們依賴於解釋執行器進行解析並執行,為了讓這類解釋型語言能夠更高效的執行,開發人員通常需要開發虛擬機,並實現垃圾回收,即時編譯等組件,讓該語言在虛擬機中執行,如Google的V8引擎。如果能讓這些語言也可以在JVM上運行並復用JVM的各種優化方案,將會減少許多重覆造輪子的消耗。這也是Truffle項目的目標。

Truffle是一個用Java編寫的解釋器實現框架。它提供瞭解釋器的開發框架介面,可以幫助開發人員用Java為自己感興趣的語言快速開發處語言解釋器,目前已經實現並維護了JavaScript、Ruby、R、Python等語言。

只需基於Truffle實現相關語言的詞法分析器、語法分析器及針對語法分析所生成的抽象語法樹(AST)的解釋執行器,便可以運行在任何Java虛擬機上,享用JVM提供的各項運行時優化。

 


GraalVM多語言運行時性能加速比

3.3.1 Partial Evaluation

Truffle的實現原理基於Partial Evaluation這一概念:假設程式prog為將輸入轉為輸出

 

其中Istatic為靜態數據,在編譯時已知常量,Idynamic為編譯時未知數據,則可以將程式等價為:

 

新程式prog為prog的特化,他應該會比原程式更高效的執行,這個從prog轉換到prog的過程便稱為Partial Evaluation。我們可以將Truffle預壓的解釋執行器當成prog,將某段由Truffle語言寫的程式當做Istatic,並通過Partial Evaluation將prog轉換到prog*。

下麵引用一個Oracle官方的例子來講解,以下程式實現了讀取參數以及參數相加的操作,需要實現讀取三個參數相加:

 

這段程式解析生成的AST為

sample = new Add(new Add(new Arg(0), new Arg(1)), new Arg(2));

 

經過Partial Evaluator 的不斷進行方法內聯最終會變成下述代碼:

 

3.3.2 節點重寫

節點重寫是Truffle的另一項關鍵優化。

在動態語言中許多變數的類型是在運行時才能確定的,以“加法”舉例,符號+即可以表示整型相加也可以表示浮點型相加。Truffle的語言解釋器會收集每個AST節點所代表的操作類型(profile),並且在編譯時做出針對所收集到的profile進行優化,如:若收集到的profile顯示這是一個整型加法操作,Truffle會在即時編譯時將AST進行變形,將“+”視為整型加法。

當然,這種優化也會有錯誤的時候,比如上述加法操作既有可能是整數加法也可能是字元串加法,此時若AST樹已變形,那麼我們只好丟棄編譯後的機器代碼,回退到AST解釋執行。這種基於類型 profile 的優化,背後的核心就是基於假設的投機性優化,以及在假設失敗時的去優化。

 

在即時編譯過後,如果運行過程中發現 AST 節點的實際類型和所假設的類型不同,Truffle 會主動調用 Graal 編譯器提供的去優化 API,返回至解釋執行 AST 節點的狀態,並且重新收集 AST 節點的類型信息。之後,Truffle 會再次利用 Graal 編譯器進行新一輪的即時編譯。

據統計,在 JavaScript 方法和 Ruby 方法中,80% 會在 5 次方法調用後穩定下來,90% 會在 7 次調用後穩定下來,99%會在 19 次方法調用之後穩定下來。

 

3.4 Sulong

Sulong子項目是GraalVM為LLVM的中間語言bitcode提供的高新更運行時工具,是基於Truffle框架實現的bitcode解釋器。Sulong為所有可以編譯到LLVM bitcode的語言(如C,C++等)提供了在JVM中執行的解決方案。

 

4 參考

  • 林子熠 《GraalVM與靜態編譯》;
  • 周志明《深入理解Java虛擬機》;
  • Java Developer’s Introduction to GraalVM:-鄭雨迪
  • Truffle/Graal:From Interpreters toOptimizing Compilers via Partial Evaluation:-Carnegie Mellon University

作者:王子豪


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • RabbitMQ 常見問題 昔我往矣,楊柳依依。今我來思,雨雪霏霏。 1、什麼是RabbitMQ? RabbitMQ是一款開源的、Erlang編寫的消息中間件;最大的特點就是消費並不需要確保提供方存在,實現了服務之間的高度解耦,可以用它來:解耦、非同步、削峰。 2、MQ的優點 非同步處理 - 相比於傳統 ...
  • 實現02 3.實現任務階段3-處理Servlet02 3.3Servlet規範設計 3.3.1MyServlet 該類模仿Servlet介面,為了簡化,只聲明瞭三個方法:init(),service(),destroy() package com.li.MyTomcat.servlet; impor ...
  • 通過創建數據表索引,有效提升系統性能。 一、問題背景 在11月10日下午5點,出現channel非同步下發消息隊列消息積壓報警,經排查分析是因為channel請求鑫某億服務商落單時間過長,導致了channel消費消息隊列的消息變慢的情況。所以,專項對鑫某億系統相關業務進行優化。 一(1)、現場 查看當 ...
  • 眾所周知,某度本身就是最大的爬蟲腳本,那麼純純的去某個網站找壁紙,還不如去某度圖片直接找,瞬間格局打開! 話不多說,直接用Python來開發一下此處資源! 開發環境 & 第三方模塊 環境 解釋器版本 >>> python 3.8 代碼編輯器 >>> pycharm 2021.2 模塊 request ...
  • Kafka 常見問題 一年將盡夜,萬里未歸人。 1、Kafka 簡介 Apache Kafka是一個分散式發佈 - 訂閱消息系統和一個強大的隊列, 可以處理大量的數據, 並使您能夠將消息從一個端點傳遞到另一個端點。 Kafka適合離線和線上消息消費,Kafka消息保留在磁碟上, 併在群集內複製以防止 ...
  • 上篇文章介紹了編寫 Yarn Application 的整體框架流程,本篇文章將詳細介紹其中 Client 部分的編寫方式。 一、Yarn Client 編寫方法 本篇代碼已上傳 Github: Github - MyYarnClient 一)編寫流程 1、創建並啟動 Client YarnClie ...
  • 1.1 Java8的概述 Java8於2014年3月發佈,該版本是 Java 語言的一個重要版本,自Java5以來最具革命性的版本,該版本包含語言、編譯器、庫、工具和JVM等方面的多個新特性。 1.2 函數式介面 函數式介面主要指只包含一個抽象方法的介面,如:java.lang.Runnable等。 ...
  • 這篇文章主要介紹如何使用字元串來設置其他值的格式(比如便於列印),並大致瞭解使用字元串方法可完成的重要任務,如拆分、合併和查找等。 ...
一周排行
    -Advertisement-
    Play Games
  • 基於.NET Framework 4.8 開發的深度學習模型部署測試平臺,提供了YOLO框架的主流系列模型,包括YOLOv8~v9,以及其系列下的Det、Seg、Pose、Obb、Cls等應用場景,同時支持圖像與視頻檢測。模型部署引擎使用的是OpenVINO™、TensorRT、ONNX runti... ...
  • 十年沉澱,重啟開發之路 十年前,我沉浸在開發的海洋中,每日與代碼為伍,與演算法共舞。那時的我,滿懷激情,對技術的追求近乎狂熱。然而,隨著歲月的流逝,生活的忙碌逐漸占據了我的大部分時間,讓我無暇顧及技術的沉澱與積累。 十年間,我經歷了職業生涯的起伏和變遷。從初出茅廬的菜鳥到逐漸嶄露頭角的開發者,我見證了 ...
  • C# 是一種簡單、現代、面向對象和類型安全的編程語言。.NET 是由 Microsoft 創建的開發平臺,平臺包含了語言規範、工具、運行,支持開發各種應用,如Web、移動、桌面等。.NET框架有多個實現,如.NET Framework、.NET Core(及後續的.NET 5+版本),以及社區版本M... ...
  • 前言 本文介紹瞭如何使用三菱提供的MX Component插件實現對三菱PLC軟元件數據的讀寫,記錄了使用電腦模擬,模擬PLC,直至完成測試的詳細流程,並重點介紹了在這個過程中的易錯點,供參考。 用到的軟體: 1. PLC開發編程環境GX Works2,GX Works2下載鏈接 https:// ...
  • 前言 整理這個官方翻譯的系列,原因是網上大部分的 tomcat 版本比較舊,此版本為 v11 最新的版本。 開源項目 從零手寫實現 tomcat minicat 別稱【嗅虎】心有猛虎,輕嗅薔薇。 系列文章 web server apache tomcat11-01-官方文檔入門介紹 web serv ...
  • 1、jQuery介紹 jQuery是什麼 jQuery是一個快速、簡潔的JavaScript框架,是繼Prototype之後又一個優秀的JavaScript代碼庫(或JavaScript框架)。jQuery設計的宗旨是“write Less,Do More”,即倡導寫更少的代碼,做更多的事情。它封裝 ...
  • 前言 之前的文章把js引擎(aardio封裝庫) 微軟開源的js引擎(ChakraCore))寫好了,這篇文章整點js代碼來測一下bug。測試網站:https://fanyi.youdao.com/index.html#/ 逆向思路 逆向思路可以看有道翻譯js逆向(MD5加密,AES加密)附完整源碼 ...
  • 引言 現代的操作系統(Windows,Linux,Mac OS)等都可以同時打開多個軟體(任務),這些軟體在我們的感知上是同時運行的,例如我們可以一邊瀏覽網頁,一邊聽音樂。而CPU執行代碼同一時間只能執行一條,但即使我們的電腦是單核CPU也可以同時運行多個任務,如下圖所示,這是因為我們的 CPU 的 ...
  • 掌握使用Python進行文本英文統計的基本方法,並瞭解如何進一步優化和擴展這些方法,以應對更複雜的文本分析任務。 ...
  • 背景 Redis多數據源常見的場景: 分區數據處理:當數據量增長時,單個Redis實例可能無法處理所有的數據。通過使用多個Redis數據源,可以將數據分區存儲在不同的實例中,使得數據處理更加高效。 多租戶應用程式:對於多租戶應用程式,每個租戶可以擁有自己的Redis數據源,以確保數據隔離和安全性。 ...