您好,登錄后才能下訂單哦!
摘要: 性能彪悍的V8引擎。
《JavaScript深入淺出》系列:
最近,JavaScript生態(tài)系統(tǒng)又多了2個(gè)非常硬核的項(xiàng)目。
大神Fabrice Bellard發(fā)布了一個(gè)新的JS引擎QuickJS,可以將JavaScript源碼轉(zhuǎn)換為C語言代碼,然后再使用系統(tǒng)編譯器(gcc或者clang)生成可執(zhí)行文件。
Facebook為React Native開發(fā)了新的JS引擎Hermes,用于優(yōu)化安卓端的性能。它可以在構(gòu)建APP的時(shí)候?qū)avaScript源碼編譯為Bytecode,從而減少APK大小、減少內(nèi)存使用,提高APP啟動(dòng)速度。
作為JavaScript程序員,只有極少數(shù)人有機(jī)會(huì)和能力去實(shí)現(xiàn)一個(gè)JS引擎,但是理解JS引擎還是很有必要的。本文將介紹一下V8引擎的原理,希望可以給大家一些幫助。
我們寫的JavaScript代碼直接交給瀏覽器或者Node執(zhí)行時(shí),底層的CPU是不認(rèn)識(shí)的,也沒法執(zhí)行。CPU只認(rèn)識(shí)自己的指令集,指令集對(duì)應(yīng)的是匯編代碼。寫匯編代碼是一件很痛苦的事情,比如,我們要計(jì)算N階乘的話,只需要7行的遞歸函數(shù):
function factorial(N) {
if (N === 1) {
return 1;
} else {
return N * factorial(N - 1);
}
}
代碼邏輯也非常清晰,與階乘數(shù)的學(xué)定義完美吻合,哪怕不會(huì)寫代碼的人也能看懂。
但是,如果使用匯編語言來寫N階乘的話,要300+行代碼n-factorial.s:
這個(gè)N階乘的匯編代碼是我大學(xué)時(shí)期寫的,已經(jīng)是N年前的事情了,它需要處理10進(jìn)制與2進(jìn)制的轉(zhuǎn)換,需要使用多個(gè)字節(jié)保存大整數(shù),最多可以計(jì)算大概500左右的N階乘。
還有一點(diǎn),不同類型的CPU的指令集是不一樣的,那就意味著得給每一種CPU重寫匯編代碼,這就很崩潰了。。。
還好,JavaScirpt引擎可以將JS代碼編譯為不同CPU(Intel, ARM以及MIPS等)對(duì)應(yīng)的匯編代碼,這樣我們才不要去翻閱每個(gè)CPU的指令集手冊(cè)。當(dāng)然,JavaScript引擎的工作也不只是編譯代碼,它還要負(fù)責(zé)執(zhí)行代碼、分配內(nèi)存以及垃圾回收。
雖然瀏覽器非常多,但是主流的JavaScirpt引擎其實(shí)很少,畢竟開發(fā)一個(gè)JavaScript引擎是一件非常復(fù)雜的事情。比較出名的JS引擎有這些:
還有,最近發(fā)布QuickJS與Hermes也是JS引擎,它們都超越了瀏覽器范疇,Atwood's Law再次得到了證明:
Any application that can be written in JavaScript, will eventually be written in JavaScript.
在為數(shù)不多JavaScript引擎中,V8無疑是最流行的,Chrome與Node.js都使用了V8引擎,Chrome的市場(chǎng)占有率高達(dá)60%,而Node.js是JS后端編程的事實(shí)標(biāo)準(zhǔn)。國內(nèi)的眾多瀏覽器,其實(shí)都是基于Chromium瀏覽器開發(fā),而Chromium相當(dāng)于開源版本的Chrome,自然也是基于V8引擎的。神奇的是,就連瀏覽器界的獨(dú)樹一幟的Microsoft也投靠了Chromium陣營。另外,Electron是基于Node.js與Chromium開發(fā)桌面應(yīng)用,也是基于V8的。
V8引擎是2008年發(fā)布的,它的命名靈感來自超級(jí)性能車的V8引擎,敢于這樣命名確實(shí)需要一些實(shí)力,它性能確實(shí)一直在穩(wěn)步提高,下面是使用Speedometer benchmark的測(cè)試結(jié)果:
V8在工業(yè)界已經(jīng)非常成功了,同時(shí)它還獲得了學(xué)術(shù)界的肯定,拿到了ACM SIGPLAN的Programming Languages Software Award:
V8's success is in large part due to the efficient machine code it generates.
Because JavaScript is a highly dynamic object-oriented language, many experts believed that this level of performance could not be achieved.
V8's performance breakthrough has had a major impact on the adoption of JavaScript, which is nowadays used on the browser, the server, and probably tomorrow on the small devices of the internet-of-things.
JavaScript是一門動(dòng)態(tài)類型語言,這會(huì)給編譯器增加很大難度,因此專家們覺得它的性能很難提高,但是V8居然做到了,生成了非常高效的machine code(其實(shí)是匯編代碼),這使得JS可以應(yīng)用在各個(gè)領(lǐng)域,比如Web、APP、桌面端、服務(wù)端以及IOT。
嚴(yán)格來講,V8所生成的代碼是匯編代碼而非機(jī)器代碼,但是V8相關(guān)的文檔、博客以及其他資料都把V8生成的代碼稱作machine code。匯編代碼與機(jī)器代碼很多是一一對(duì)應(yīng)的,也很容易互相轉(zhuǎn)換,這也是反編譯的原理,因此他們把V8生成的代碼稱為Machine Code也未嘗不可,但是并不嚴(yán)謹(jǐn)。
V8是一個(gè)非常復(fù)雜的項(xiàng)目,使用cloc統(tǒng)計(jì)可知,它竟然有超過100萬行C++代碼。
V8由許多子模塊構(gòu)成,其中這4個(gè)模塊是最重要的:
其中,Parser,Ignition以及TurboFan可以將JS源碼編譯為匯編代碼,其流程圖如下:
簡(jiǎn)單地說,Parser將JS源碼轉(zhuǎn)換為AST,然后Ignition將AST轉(zhuǎn)換為Bytecode,最后TurboFan將Bytecode轉(zhuǎn)換為經(jīng)過優(yōu)化的Machine Code(實(shí)際上是匯編代碼)。
圖片中的紅線是逆向的,這的確有點(diǎn)奇怪,Optimized Machine Code會(huì)被還原為Bytecode,這個(gè)過程叫做Deoptimization。這是因?yàn)镮gnition收集的信息可能是錯(cuò)誤的,比如add函數(shù)的參數(shù)之前是整數(shù),后來又變成了字符串。生成的Optimized Machine Code已經(jīng)假定add函數(shù)的參數(shù)是整數(shù),那當(dāng)然是錯(cuò)誤的,于是需要進(jìn)行Deoptimization。
function add(x, y) {
return x + y;
}
add(1, 2);
add("1", "2");
在運(yùn)行C、C++以及Java等程序之前,需要進(jìn)行編譯,不能直接執(zhí)行源碼;但對(duì)于JavaScript來說,我們可以直接執(zhí)行源碼(比如:node server.js),它是在運(yùn)行的時(shí)候先編譯再執(zhí)行,這種方式被稱為即時(shí)編譯(Just-in-time compilation),簡(jiǎn)稱為JIT。因此,V8也屬于JIT編譯器。
Node.js是基于V8引擎實(shí)現(xiàn)的,因此node命令提供了很多V8引擎的選項(xiàng),使用node的--print-bytecode
選項(xiàng),可以打印出Ignition生成的Bytecode。
factorial.js如下,由于V8不會(huì)編譯沒有被調(diào)用的函數(shù),因此需要在最后一行調(diào)用factorial函數(shù)。
function factorial(N) {
if (N === 1) {
return 1;
} else {
return N * factorial(N - 1);
}
}
factorial(10); // V8不會(huì)編譯沒有被調(diào)用的函數(shù),因此這一行不能省略
使用node命令(node版本為12.6.0)的--print-bytecode
選項(xiàng),打印出Ignition生成的Bytecode:
node --print-bytecode factorial.js
控制臺(tái)輸出的內(nèi)容非常多,最后一部分是factorial函數(shù)的Bytecode:
[generated bytecode for function: factorial]
Parameter count 2
Register count 3
Frame size 24
18 E> 0x3541c2da112e @ 0 : a5 StackCheck
28 S> 0x3541c2da112f @ 1 : 0c 01 LdaSmi [1]
34 E> 0x3541c2da1131 @ 3 : 68 02 00 TestEqualStrict a0, [0]
0x3541c2da1134 @ 6 : 99 05 JumpIfFalse [5] (0x3541c2da1139 @ 11)
51 S> 0x3541c2da1136 @ 8 : 0c 01 LdaSmi [1]
60 S> 0x3541c2da1138 @ 10 : a9 Return
82 S> 0x3541c2da1139 @ 11 : 1b 04 LdaImmutableCurrentContextSlot [4]
0x3541c2da113b @ 13 : 26 fa Star r1
0x3541c2da113d @ 15 : 25 02 Ldar a0
105 E> 0x3541c2da113f @ 17 : 41 01 02 SubSmi [1], [2]
0x3541c2da1142 @ 20 : 26 f9 Star r2
93 E> 0x3541c2da1144 @ 22 : 5d fa f9 03 CallUndefinedReceiver1 r1, r2, [3]
91 E> 0x3541c2da1148 @ 26 : 36 02 01 Mul a0, [1]
110 S> 0x3541c2da114b @ 29 : a9 Return
Constant pool (size = 0)
Handler Table (size = 0)
生成的Bytecode其實(shí)挺簡(jiǎn)單的:
不難發(fā)現(xiàn),Bytecode某種程度上就是匯編語言,只是它沒有對(duì)應(yīng)特定的CPU,或者說它對(duì)應(yīng)的是虛擬的CPU。這樣的話,生成Bytecode時(shí)簡(jiǎn)單很多,無需為不同的CPU生產(chǎn)不同的代碼。要知道,V8支持9種不同的CPU,引入一個(gè)中間層Bytecode,可以簡(jiǎn)化V8的編譯流程,提高可擴(kuò)展性。
如果我們?cè)诓煌布先ド葿ytecode,會(huì)發(fā)現(xiàn)生成代碼的指令是一樣的:
使用node命令的--print-code
以及--print-opt-code
選項(xiàng),打印出TurboFan生成的匯編代碼:
node --print-code --print-opt-code factorial.js
我是在Mac上運(yùn)行的,結(jié)果如下圖所示:
比起B(yǎng)ytecode,正真的匯編代碼可讀性差很多。而且,機(jī)器的CPU類型不一樣的話,生成的匯編代碼也不一樣。
這些匯編代碼就不用去管它了,因?yàn)樽钪匾氖抢斫釺urboFan是如何優(yōu)化所生成的匯編代碼的。我們可以通過add函數(shù)來梳理整個(gè)優(yōu)化過程。
function add(x, y) {
return x + y;
}
add(1, 2);
add(3, 4);
add(5, 6);
add("7", "8");
由于JS的變量是沒有類型的,所以add函數(shù)的參數(shù)可以是任意類型:Number、String、Boolean等,這就意味著add函數(shù)可能是數(shù)字相加(V8還會(huì)區(qū)分整數(shù)和浮點(diǎn)數(shù)),可能是字符串拼接,也可能是其他更復(fù)雜的操作。如果直接編譯的話,生成的代碼比如會(huì)有很多if...else分支,偽代碼如下:
if (isInteger(x) && isInteger(y)) {
// 整數(shù)相加
} else if (isFloat(x) && isFloat(y)) {
// 浮點(diǎn)數(shù)相加
} else if (isString(x) && isString(y)) {
// 字符串拼接
} else {
// 各種其他情況
}
我只寫了4個(gè)分支,實(shí)際上的分支其實(shí)更多,比如當(dāng)參數(shù)類型不一致時(shí)還得進(jìn)行類型轉(zhuǎn)換,大家不妨看看ECMASCript對(duì)加法是如何定義的:12.8.3The Addition Operator ( + )。
如果直接按照偽代碼去生成匯編代碼,那生成的代碼必然非常冗長(zhǎng),這樣會(huì)占用很多內(nèi)存空間。
Ignition在執(zhí)行add(1, 2)
時(shí),已經(jīng)知道add函數(shù)的兩個(gè)參數(shù)都是整數(shù),那么TurboFan在編譯Bytecode時(shí),就可以假定add函數(shù)的參數(shù)是整數(shù),這樣可以極大地簡(jiǎn)化生成的匯編代碼,偽代碼如下:
if (isInteger(x) && isInteger(y)) {
// 整數(shù)相加
} else {
// Deoptimization
}
當(dāng)然這樣做也是有風(fēng)險(xiǎn)的,因?yàn)槿绻鸻dd函數(shù)參數(shù)不是整數(shù),那么生成的匯編代碼也沒法執(zhí)行,只能Deoptimize為Bytecode來執(zhí)行。
也就是說,如果TurboFan對(duì)add函數(shù)進(jìn)行編譯優(yōu)化的話,則add(3, 4)
與add(3, 4)
可以執(zhí)行優(yōu)化的匯編代碼,但是add("7", "8")
只能Deoptimize為Bytecode來執(zhí)行。
當(dāng)然,TurboFan所做的也不只是根據(jù)類型信息來簡(jiǎn)化代碼執(zhí)行流程,它還會(huì)進(jìn)行其他優(yōu)化,比如減少冗余代碼等更復(fù)雜的事情。
由這個(gè)簡(jiǎn)單的例子可知,如果我們的JS代碼中變量的類型變來變?nèi)?,是?huì)給V8引擎增加不少麻煩的,為了提高性能,我們可以盡量不要去改變變量的類型。
對(duì)于性能要求比較高的項(xiàng)目,使用TypeScript也是不錯(cuò)的選擇,理論上,如果嚴(yán)格遵守類型化的編程方式,也是可以提高性能的,類型化的代碼有利于V8引擎優(yōu)化編譯的匯編代碼,當(dāng)然這一點(diǎn)還需要測(cè)試數(shù)據(jù)來證明。
強(qiáng)大的垃圾回收功能是V8實(shí)現(xiàn)提高性能的關(guān)鍵之一,因?yàn)樗梢栽诒苊庥绊慗S代碼執(zhí)行的情況下,同時(shí)回收內(nèi)存空間,提高內(nèi)存利用效率。
關(guān)于垃圾回收,我在JavaScript深入淺出第3課:什么是垃圾回收算法?中有詳細(xì)介紹,這里就不再贅述了。
V8引擎確實(shí)很強(qiáng)大,但是它也不是無所不能的,簡(jiǎn)單地分析都可以發(fā)現(xiàn)一些可以優(yōu)化的點(diǎn)。
我有一個(gè)新的想法,還沒想好名字,不妨稱作Optimized TypeScript Engine:
這個(gè)想法其實(shí)可以基于V8引擎來實(shí)現(xiàn),技術(shù)上應(yīng)該是可行的:
這樣做,可以將JS引擎簡(jiǎn)化很多,一方面不再需要parse以及生成bytecode,另一方面編譯器不再需要因?yàn)镴avaScript動(dòng)態(tài)特性做很多額外的工作。因此可以減少CPU、內(nèi)存以及電量的使用,優(yōu)化性能,唯一的問題可能是必須使用嚴(yán)格的TS語法進(jìn)行編程。
為啥要這樣做呢?因?yàn)閷?duì)于IOT硬件來說,CPU、內(nèi)存、電量都是需要省著點(diǎn)用的,不是每一個(gè)智能家電都需要裝一個(gè)驍龍855,如果希望把JS應(yīng)用到IOT領(lǐng)域,必然需要從JS引擎角度去進(jìn)行優(yōu)化,只是去做上層的框架是沒有用的。
其實(shí),F(xiàn)acebook的Hermes差不多就是這么干的,只是它沒有要求用TS編程。
這應(yīng)該是JS引擎的未來,大家會(huì)看到越來越多這樣的趨勢(shì)。
關(guān)于JS,我打算花1年時(shí)間寫一個(gè)系列的博客《JavaScript深入淺出》,大家還有啥不太清楚的地方?不妨留言一下,我可以研究一下,然后再與大家分享一下。歡迎添加我的個(gè)人微信(KiwenLau),我是Fundebug的技術(shù)負(fù)責(zé)人,一個(gè)對(duì)JS又愛又恨的程序員。
Fundebug專注于JavaScript、微信小程序、微信小游戲、支付寶小程序、React Native、Node.js和Java線上應(yīng)用實(shí)時(shí)BUG監(jiān)控。 自從2016年雙十一正式上線,F(xiàn)undebug累計(jì)處理了10億+錯(cuò)誤事件,付費(fèi)客戶有陽光保險(xiǎn)、核桃編程、荔枝FM、掌門1對(duì)1、微脈、青團(tuán)社等眾多品牌企業(yè)。歡迎大家免費(fèi)試用!
轉(zhuǎn)載時(shí)請(qǐng)注明作者 Fundebug以及本文地址:
https://blog.fundebug.com/2019/07/16/how-does-v8-work/
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。