溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

c++ atomic原子編程中Memory Order的示例分析

發(fā)布時間：2021-06-07 14:47:57 來源：億速云閱讀：153 作者：小新欄目：開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)c++ atomic原子編程中Memory Order的示例分析的內(nèi)容。小編覺得挺實用的，因此分享給大家做個參考，一起跟隨小編過來看看吧。

概述

但是，基于內(nèi)核對象的同步，會帶來昂貴的上下文切換（用戶態(tài)切換到內(nèi)核態(tài)，占用1000個以上的cpu周期）。就需要使用另一種方法 —— 原子指令。

c++ atomic原子編程中Memory Order的示例分析

僅靠原子技術(shù)實現(xiàn)不了對資源的訪問控制，即使簡單計數(shù)操作，看上去正確的代碼也可能會crash。

這里的關(guān)鍵在于編譯器和cpu實施的重排指令導致了讀寫順序的變化。只要沒有依賴，代碼中在后面的指令就可能跑到前面去，編譯器和CPU都會這么做。

注1：單線程代碼不需要關(guān)心亂序的問題。因為亂序至少要保證這一原則：不能改變單線程程序的執(zhí)行行為

注2：內(nèi)核對象多線程編程在設(shè)計的時候都阻止了它們調(diào)用點中的亂序（已經(jīng)隱式包含memory barrier），不需要考慮亂序的問題。

注3：使用用戶模式下的線程同步時，亂序的效果才會顯露無疑。

程序員可以使用c++11 atomic提供了6種memory order，來在編程語言層面對編譯器和cpu實施的重排指令行為進行控制

c++ atomic原子編程中Memory Order的示例分析

多線程編程時，通過這些標志位，來讀寫原子變量，可以組合出4種同步模型：

Relaxed ordering

Release-Acquire ordering

Release-Consume ordering

Sequentially-consistent ordering

默認情況下，std::atomic使用的是Sequentially-consistent ordering(最嚴格的同步模型)。但在某些場景下，合理使用其它3種ordering，可以讓編譯器優(yōu)化生成的代碼，從而提高性能。

Relaxed ordering

在這種模型下，std::atomic的load()和store()都要帶上memory_order_relaxed參數(shù)。Relaxed ordering僅僅保證load()和store()是原子操作，除此之外，不提供任何跨線程的同步。

先看看一個簡單的例子：

std::atomic<int> x = 0;     // global variable
std::atomic<int> y = 0;     // global variable
		  
Thread-1:                                  Thread-2:
r1 = y.load(memory_order_relaxed); // A    r2 = x.load(memory_order_relaxed); // C
x.store(r1, memory_order_relaxed); // B    y.store(42, memory_order_relaxed); // D

執(zhí)行完上面的程序，可能出現(xiàn)r1 == r2 == 42。理解這一點并不難，因為編譯器允許調(diào)整 C 和 D 的執(zhí)行順序。

如果程序的執(zhí)行順序是 D -> A -> B -> C，那么就會出現(xiàn)r1 == r2 == 42。

如果某個操作只要求是原子操作，不需要其它同步的保障，就可以使用 Relaxed ordering。程序計數(shù)器是一種典型的應(yīng)用場景。

#include <cassert>
#include <vector>
#include <iostream>
#include <thread>
#include <atomic>
std::atomic<int> cnt = {0};
void f()
{
    for (int n = 0; n < 1000; ++n) {
        cnt.fetch_add(1, std::memory_order_relaxed);
    }
}
int main()
{
    std::vector<std::thread> v;
    for (int n = 0; n < 10; ++n) {
        v.emplace_back(f);
    }
    for (auto& t : v) {
        t.join();
    }
    assert(cnt == 10000);    // never failed
    return 0;
}

Release-Acquire ordering

在這種模型下，store()使用memory_order_release，而load()使用memory_order_acquire。這種模型有兩種效果，第一種是可以限制 CPU 指令的重排：

（1）在store()之前的所有讀寫操作，不允許被移動到這個store()的后面。 // write-release語義

（2）在load()之后的所有讀寫操作，不允許被移動到這個load()的前面。 // read-acquire語義

該模型可以保證：如果Thread-1的store()的那個值，成功被 Thread-2的load()到了，那么 Thread-1在store()之前對內(nèi)存的所有寫入操作，此時對 Thread-2 來說，都是可見的。

下面的例子闡述了這種模型的原理：

#include <thread>
#include <atomic>
#include <cassert>
#include <string>
std::atomic<bool> ready{ false };
int data = 0;
void producer()
{
    data = 100;                                       // A
    ready.store(true, std::memory_order_release);     // B
}
void consumer()
{
    while (!ready.load(std::memory_order_acquire))    // C
        ;
    assert(data == 100); // never failed              // D
}
int main()
{
    std::thread t1(producer);
    std::thread t2(consumer);
    t1.join();
    t2.join();
    return 0;
}

讓我們分析一下這個過程：

首先 A 不允許被移動到 B 的后面。

同樣 D 也不允許被移動到 C 的前面。

當 C 從 while 循環(huán)中退出了，說明 C 讀取到了 B store()的那個值，此時，Thread-2 保證能夠看見 Thread-1 執(zhí)行 B 之前的所有寫入操作（也即是 A）。

使用Release-Acquire ordering實現(xiàn)雙重檢查鎖模式(DLCP)

下面單件為例來說明：

class Singleton
{
public:
    static Singleton* get_instance() {
        Singleton* tmp = instance_.load(std::memory_order_acquire);
        if (tmp == nullptr) {
            std::unique_lock<std::mutex> lk(mutex_);
            tmp = instance_;
            if (tmp == nullptr) {
                tmp = new Singleton();
                instance_.store(std::memory_order_release);
            }
        }
        return tmp;
    }

private:
    Singleton() = default;
    static std::atomic<Singleton*> instance_;
    static std::mutex mutex_;
};

使用Release-Acquire ordering實現(xiàn)自旋鎖(Spinlock)

獲取和釋放語義，是實現(xiàn)鎖的基礎(chǔ)(Spinlock, Mutex, RWLock, ...)，所有被[Read Acquire,Write Release]包含的區(qū)域，即構(gòu)成了一個臨界區(qū)，臨界區(qū)里的內(nèi)存操作，不會亂序到臨界區(qū)之外執(zhí)行。

read-acquire(判斷是否加鎖，沒則加鎖，否則循環(huán)等待)
-------------------------------------------------------------------------

all memory operation stay between the line（臨界區(qū)）

-------------------------------------------------------------------------
write-release(釋放鎖)

實現(xiàn)代碼如下：

#include <atomic>
class simple_spin_lock
{
public:
    simple_spin_lock() = default;
    void lock()
    {
        while (flag.test_and_set(std::memory_order_acquire))
            continue;
    }
    void unlock()
    {
        flag.clear(std::memory_order_release);
    }
private:
    simple_spin_lock(const simple_spin_lock&) = delete;
    simple_spin_lock& operator =(const simple_spin_lock&) = delete;
    std::atomic_flag flag = ATOMIC_FLAG_INIT;
};

①對std::atomic_flag的操作具有原子性，保證了同一時間，只有一個線程能夠lock成功，其余線程全部在while循環(huán)

②使用了acquire內(nèi)存屏障，所以lock具有獲取語義

③使用了release內(nèi)存屏障，所以unlock具有釋放語義

Release-Consume ordering

在這種模型下，store()使用memory_order_release，而load()使用memory_order_consume。這種模型有兩種效果，第一種是可以限制 CPU 指令的重排：

（1）在store()之前的所有讀寫操作，不允許被移動到這個store()的后面。

（2）在load()之后的所有依賴此原子變量的讀寫操作，不允許被移動到這個load()的前面。

注：不依賴此原子變量的讀寫操作可能會CPU指令重排

下面的例子闡述了這種模型的原理：

#include <thread>
#include <atomic>
#include <cassert>
#include <string>

std::atomic<std::string*> ptr;
int data;
// thread1
void producer()
{
    std::string* p  = new std::string("Hello"); // A
    data = 42; // B
    ptr.store(p, std::memory_order_release); // C
}
// thread2
void consumer()
{
    std::string* p2;
    while (!(p2 = ptr.load(std::memory_order_consume))) // D
        ;
    assert(*p2 == "Hello"); //E     always true: *p2 carries dependency from ptr
    assert(data == 42); // F     may be false: data does not carry dependency from ptr
}

int main()
{
    std::thread t1(producer);
    std::thread t2(consumer);
    t1.join(); 
    t2.join();
    return 0;
}

Sequentially-consistent ordering

所有以memory_order_seq_cst為參數(shù)的原子操作(不限于同一個原子變量)，對所有線程來說有一個全局順序(total order)

并且兩個相鄰memory_order_seq_cst原子操作之間的其他操作(包括非原子變量操作)，不能reorder到這兩個相鄰操作之外

UE4下的Memory Order

enum class EMemoryOrder
{
    // Provides no guarantees that the operation will be ordered relative to any other operation.
    Relaxed,

    // Establishes a single total order of all other atomic operations marked with this.
    SequentiallyConsistent  // Load和Store函數(shù)缺省為該類型
};

詳見：UnrealEngine\Engine\Source\Runtime\Core\Public\Templates\Atomic.h

Atomic相關(guān)的測試代碼見：UnrealEngine\Engine\Source\Runtime\Core\Private\Tests\Misc\AtomicTest.cpp

c++ atomic原子編程中Memory Order的示例分析

感謝各位的閱讀！關(guān)于“c++ atomic原子編程中Memory Order的示例分析”這篇文章就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，讓大家可以學到更多知識，如果覺得文章不錯，可以把它分享出去讓更多的人看到吧！

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Python中如何實現(xiàn)二叉排序樹的定義、查找、插入、構(gòu)造、刪除操作
下一篇新聞：
Java開發(fā)工具Maven怎么用

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼