溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

C語言volatile關(guān)鍵字的作用是什么

發(fā)布時(shí)間:2023-04-19 11:21:30 來源:億速云 閱讀:84 作者:iii 欄目:開發(fā)技術(shù)

本篇內(nèi)容介紹了“C語言volatile關(guān)鍵字的作用是什么”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

寫在前面

版本信息:Linux操作系統(tǒng),x86架構(gòu),Linux操作系統(tǒng)下GCC9.3.1版本。GCC 9.3.0手冊。

先看一下GCC文檔給的volatile說明:

C語言volatile關(guān)鍵字的作用是什么

一言以蔽之:讓編譯器不再去優(yōu)化被volatile修飾的變量的操作。但是volatile并不能做內(nèi)存屏障的功能,想使用內(nèi)存屏障請使用平臺相關(guān)的屏障指令,比如GCC提供了一個(gè)內(nèi)聯(lián)asm volatile ("" : : : "memory");的編譯器屏障。詳情平臺相關(guān)的內(nèi)存屏障請關(guān)注特定平臺的操作手冊~!

既然上述說明了volatile關(guān)鍵字可以避免編譯器優(yōu)化,那么下面筆者用2個(gè)列子來說明一下。

// 沒優(yōu)化:
int a = 10;
int b = a;
int c = a;
int d = a;
// 對應(yīng)的匯編代碼
sub 16,esp             // 開辟棧幀
mov $10,(esp-12)       // 把立即數(shù)10放入到esp-12的棧幀位置,這也對應(yīng)a變量。
mov (esp-12) (esp-8)   // 把(esp-12)的值放入到(esp-8)的位置,這也對應(yīng)b變量
mov (esp-12) (esp-4)   // 把(esp-12)的值放入到(esp-4)的位置,這也對應(yīng)c變量
mov (esp-12) (esp)     // 把(esp-12)的值放入到(esp)的位置,這也對應(yīng)d變量
// 總結(jié),每次從內(nèi)存中拿

比如這個(gè)很簡單的列子,定義一個(gè)變量a,然后把a(bǔ)賦值給b、c、d。

看匯編代碼,可以清楚的看到,每次賦值都是從內(nèi)存地址中拿去值,這也就需要訪問多次內(nèi)存。影響到代碼的執(zhí)行效率。那么,編譯器會如何優(yōu)化呢?

既然b、c、d都使用的a變量,而A變量為10,那么可不可以這樣寫呢?

// 優(yōu)化:
int a = 10;
int b = 10;
int c = 10;
int d = 10;
// 對應(yīng)的匯編代碼:
sub 16,esp        // 開辟棧幀
mov $10,(esp-12)  // 把立即數(shù)10放入到esp-12的棧幀位置,這也對應(yīng)a變量。
mov (esp-12),eax  // 把esp-12的棧幀位置對應(yīng)的值,也就是10放入到eax寄存器中。
mov eax (esp-8)   // 把eax寄存器的值放入到(esp-8)的位置,這也對應(yīng)b變量
mov eax (esp-4)   // 把eax寄存器的值放入到(esp-4)的位置,這也對應(yīng)c變量
mov eax (esp)     // 把eax寄存器的值放入到(esp)的位置,這也對應(yīng)d變量
// 總結(jié),每次從eax寄存器拿,此時(shí),可以把eax想成一個(gè)緩存寄存器。

可以從匯編代碼看出,把a(bǔ)變量的值放入到eax寄存器中,然后把eax寄存器的值賦值給b、c、d變量,這樣就只需要訪問一次內(nèi)存了。此時(shí),我們需要考慮,假如賦值b、c、d的過程中,a的值發(fā)生了改變了呢?那么對于b、c、d來說還是賦值的原值,所以就出現(xiàn)了問題。

這是一個(gè)很簡單的編譯器優(yōu)化的例子,代碼就是假設(shè)的代碼,匯編也是偽匯編,那么,為得到讀者的認(rèn)可,筆者也是寫了一個(gè)真實(shí)的案例。

// demo.c案例
#include <stdlib.h>
#include <stdio.h>
#include <pthread.h>
#include <errno.h>
/*全局變量*/
int gnum = 1;
/*線程1的服務(wù)程序*/
static void pthread_func_1 (void)
{
   while(gnum == 1){
   }
}
int main (void)
{
 /*線程的標(biāo)識符*/
  pthread_t pt_1 = 0;
  int ret = 0;
  /*
    創(chuàng)建線程1
  */
  ret = pthread_create( &pt_1,                  //線程標(biāo)識符指針
                                     NULL,                  //默認(rèn)屬性
                                     (void *)pthread_func_1,//運(yùn)行函數(shù)
                                     NULL);                  //無參數(shù)
  if (ret != 0)
  {
     perror ("pthread_1_create");
  }
  /* 主線程停1秒,讓p1線程成功被CPU調(diào)度 */
  sleep(1);
  /* 改變?nèi)謱傩詆num的值,讓p1線程停下來。 */
  gnum = 0;
  /* 等待線程1的結(jié)束 */
  pthread_join (pt_1, NULL);
  printf ("main programme exit!/n");
  return 0;
}

這段代碼很簡單,使用pthread創(chuàng)建一個(gè)p1線程,p1線程里面寫了一個(gè)while循環(huán),循環(huán)條件是判斷全局變量gnum是否為1。main線程啟動(dòng)p1線程,同時(shí)main線程休眠1秒,讓p1線程得到CPU的調(diào)度,然后把全局變量gnum設(shè)置為0,讓p1線程的while結(jié)束。main線程使用join等待p1線程執(zhí)行結(jié)束,p1線程結(jié)束后main線程打印main programme exit。

gcc普通編譯:

// gcc普通編譯后
gcc -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
000000000040068d <pthread_func_1>:
  40068d: 55                    push   %rbp
  40068e: 48 89 e5              mov    %rsp,%rbp
  400691: 90                    nop
  400692: 8b 05 bc 09 20 00     mov    0x2009bc(%rip),%eax        # 601054 <gnum>       // 每次還從0x2009bc(%rip)獲取全局的gnum變量放入eax寄存器
  400698: 83 f8 01              cmp    $0x1,%eax                                        // 拿1和eax寄存器做比較,比較結(jié)果放入到flags寄存器中。
  40069b: 74 f5                 je     400692 <pthread_func_1+0x5>                      // 如果比較成功就直接跳到400692這行代碼段地址,如果不成功就直接往下執(zhí)行
  40069d: 5d                    pop    %rbp
  40069e: c3                    retq

可以清楚的看到每次都是從0x2009bc(%rip)獲取值給%eax寄存器,然后cmp做比較,je是成功就跳轉(zhuǎn)到400692代碼段地址。然后繼續(xù)mov獲取值,cmp比較,je跳轉(zhuǎn),周而復(fù)始......

gcc -O4編譯:

// gcc -O4編譯后
gcc -O4 -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
00000000004006f0 <pthread_func_1>:
  4006f0: 83 3d 69 09 20 00 01  cmpl   $0x1,0x200969(%rip)        # 601060 <gnum>       // 比較一次,把結(jié)果放入到flags寄存器中
  4006f7: 75 07                 jne    400700 <pthread_func_1+0x10>                     // 如果不等于就直接退出
  4006f9: eb fe                 jmp    4006f9 <pthread_func_1+0x9>                      // 一直循環(huán)本行,也就是直接無腦死循環(huán)(沒有退出條件的死循環(huán))
  4006fb: 0f 1f 44 00 00        nopl   0x0(%rax,%rax,1)
  400700: f3 c3                 repz retq 
  400702: 66 2e 0f 1f 84 00 00  nopw   %cs:0x0(%rax,%rax,1)
  400709: 00 00 00 
  40070c: 0f 1f 40 00           nopl   0x0(%rax)

這里執(zhí)行的話就直接死循環(huán)了。

這里也比較直觀,cmpl比較一次,如果不等于就jne直接返回,如果等于就執(zhí)行jmp 4006f9,就開始無退出條件的死循環(huán)了,不管你后續(xù)全局變量gnum值是否改變都無條件死循環(huán)。所以這就是編譯器優(yōu)化,導(dǎo)致的問題,那么使用volatile修飾全局變量gnum,看看效果。

volatile修飾后gcc -O4編譯:

// volatile修飾后gcc -O4編譯: 
gcc -O4 -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
00000000004006f0 <pthread_func_1>:
  4006f0: 8b 05 5e 09 20 00     mov    0x20095e(%rip),%eax        # 601054 <gnum>       // 每次從0x20095e(%rip)獲取全局的gnum變量放入eax寄存器
  4006f6: 83 f8 01              cmp    $0x1,%eax                                        // 拿1和eax寄存器做比較,比較結(jié)果放入到flags寄存器中。
  4006f9: 74 f5                 je     4006f0 <pthread_func_1>                          // 如果比較成功就直接跳到4006f0這行代碼段地址,如果不成功就直接往下執(zhí)行
  4006fb: f3 c3                 repz retq 
  4006fd: 0f 1f 00              nopl   (%rax)

volatile 和gcc的O4優(yōu)化后的代碼特別特別的精簡??梢郧宄目吹絤ov 0x20095e(%rip),%eax每次都從0x20095e(%rip)地址獲取變量給eax寄存器,然后cmp比較,je跳轉(zhuǎn)。所以這跟普通編譯的寫法是是一樣的(單指操作被volatile修飾的變量)

內(nèi)聯(lián)匯編volatile修飾后gcc -O4編譯:

int gnum = 1;
/*線程1的服務(wù)程序*/
static void pthread_func_1 (void)
{
   while(gnum == 1){
     __asm__ __volatile__("": : :"memory")
   }
}
// 使用內(nèi)聯(lián)匯編volatile編譯器優(yōu)化: 
gcc -O4 -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
00000000004006f0 <pthread_func_1>:
  4006f0: eb 06                 jmp    4006f8 <pthread_func_1+0x8>
  4006f2: 66 0f 1f 44 00 00     nopw   0x0(%rax,%rax,1)
  4006f8: 83 3d 61 09 20 00 01  cmpl   $0x1,0x200961(%rip)        # 601060 <gnum>       // 拿0x200961(%rip)全局變量gnum的值和1比較。
  4006ff: 74 f7                 je     4006f8 <pthread_func_1+0x8>                      // 如果相等就跳轉(zhuǎn)到4006f8。
  400701: f3 c3                 repz retq 
  400703: 66 2e 0f 1f 84 00 00  nopw   %cs:0x0(%rax,%rax,1)
  40070a: 00 00 00 
  40070d: 0f 1f 00              nopl   (%rax)

這里cmpl直接比較,然后je跳轉(zhuǎn)。比較精簡。每次也是從0x200961(%rip)地址獲取最新值。所以不會出現(xiàn)無條件的死循環(huán)的情況。

volatile和內(nèi)聯(lián)匯編的volatile的選擇

在Linux內(nèi)核中,禁止volatile關(guān)鍵字的出現(xiàn),但是里面都是使用內(nèi)聯(lián)匯編volatile的形式禁止編譯器優(yōu)化,當(dāng)然內(nèi)存屏障也是可以禁止編譯器優(yōu)化的(對于內(nèi)存屏障這里點(diǎn)到即可,詳情看不同平臺的操作手冊)。當(dāng)然Linux內(nèi)核代碼量特別大,如果很多地方不讓編譯器優(yōu)化的話,效率會降低,一個(gè)操作系統(tǒng)如果性能都不行,那肯定是說不過去的。

如下圖所示:使用了volatile修飾的變量在不同的代碼段之間執(zhí)行都會影響到代碼段的優(yōu)化,而內(nèi)聯(lián)匯編volatile就可以按需選擇,就不會全部影響到。所以讀者可以按需選擇。

C語言volatile關(guān)鍵字的作用是什么

“C語言volatile關(guān)鍵字的作用是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI