溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

馬爾可夫鏈你知道多少?Python可視化解析MCMC

發(fā)布時間:2020-08-11 13:49:09 來源:ITPUB博客 閱讀:223 作者:千鋒Python唐小強 欄目:編程語言

馬爾可夫鏈(Markov Chain),又稱為離散時間馬爾可夫鏈,可以定義為一個隨機(jī)過程Y,在某時間t上的任何一個點的值僅僅依賴于在時間t-1上的值。這就表示了我們的隨機(jī)過程在時間t上具有狀態(tài)x的概率,如果給出它之前所有的狀態(tài),那么就相當(dāng)于在僅給出它在時間t-1的狀態(tài)的時候,在時間t上具有狀態(tài)x的概率。

馬爾可夫鏈你知道多少?Python可視化解析MCMC

如果可能的狀態(tài)集S是有限的,那么,我們可以提供馬爾可夫鏈的可視化表示結(jié)果,如下圖所示:

馬爾可夫鏈你知道多少?Python可視化解析MCMC

上圖中的每個圓圈都代表了一個狀態(tài),在這種情況下S={A, B, C},而箭頭則表示過程從一個狀態(tài)跳到另一個狀態(tài)的概率。我們可以在一個稱為“轉(zhuǎn)移矩陣”P中收集所有的這些概率數(shù)據(jù),如下圖所示:

馬爾可夫鏈你知道多少?Python可視化解析MCMC

那么,就有:

馬爾可夫鏈你知道多少?Python可視化解析MCMC

然后,在每個時間點上,我們可以描述過程的(無條件的)概率分布,這將是一個向量,其分量數(shù)等于S的維數(shù)。每個分量表示我們的過程取值等于給定狀態(tài)的無條件概率。也就是:

馬爾可夫鏈你知道多少?Python可視化解析MCMC

關(guān)于上式中變量μ的比較有趣的性質(zhì)是,它會通過以下等式的關(guān)系與轉(zhuǎn)移矩陣相關(guān)聯(lián):

馬爾可夫鏈你知道多少?Python可視化解析MCMC

因此,一旦我們有了向量的已知初始值(這是可以理解的,因為我們是從一個可觀察的狀態(tài)開始的,因此將有一個包含多個0的向量,但在初始狀態(tài)的位置上只有一個0),這樣就可以計算過程在任何時間點上的分布了。

與此同時,我們的向量有一個特定的值,以使下面這個等式成立:

馬爾可夫鏈你知道多少?Python可視化解析MCMC

如果存在如上所述的一個值,我們將相應(yīng)的變量μ稱為過程的不變分布。

在討論馬爾可夫鏈蒙特卡羅(MCMC)方法的時候,不變分布是一個關(guān)鍵的概念。它包括一類從概率分布中抽樣的算法,這個概率分布構(gòu)造了一個馬爾可夫鏈,而這個馬爾可夫鏈則希望把這個分布作為它的不變分布。

事實上,蒙特卡羅方法的目標(biāo)是要從不易抽樣的分布中找到抽樣的方法。要繞過這個問題,我們已有了一些方法,如拒絕抽樣和重要性抽樣等等,它們使用了一個更簡單的函數(shù),稱為“proposal”

讓我們模擬一個馬爾可夫鏈,現(xiàn)在,考慮一個變量,今天的狀態(tài)可能只取決于昨天的狀態(tài),這個變量有可能指的是天氣。所以讓我們考慮下面的馬爾可夫鏈:

馬爾可夫鏈你知道多少?Python可視化解析MCMC

我們可以用以前的方法來解釋上圖。也就是說,如果今天是晴天,則明天也是晴天的概率是50%,而下雨的概率是15%,是多云天氣的概率是35%。

我們可以在以下的轉(zhuǎn)移矩陣中收集表示上圖中箭頭的數(shù)組:

import numpy as np P = np.array([[0.5, 0.15, 0.35], [0.45, 0.45, 0.1], [0.1, 0.3, 0.6]]) P Output: array([[0.5 , 0.15, 0.35], [0.45, 0.45, 0.1 ], [0.1 , 0.3 , 0.6 ]])

另外,也有一個初始值,比如說“多云”,因此我們已經(jīng)有了y的初始分布,即μ _0=[0,0,1]。

由于我們有一個初始的變量μ和一個轉(zhuǎn)移矩陣,因此就可以在任意時間點t上計算μ的值。因此,有了這些之后,我想根據(jù)每個t值的概率分布來創(chuàng)建一個隨機(jī)過程(具有馬爾可夫鏈的屬性,因此可以只依賴于前一個時間段)。

這意味著我得到的隨機(jī)變量Y將會有一些等于瞬間數(shù)量的分量,而每個分量都是根據(jù)瞬間的概率分布來實現(xiàn)的過程。為此,我們希望從均勻分布中生成一個隨機(jī)數(shù),并設(shè)置如下規(guī)則:

馬爾可夫鏈你知道多少?Python可視化解析MCMC

讓我們用Python語言來實現(xiàn)程序代碼。為此,我假設(shè)了50天的測試,然后我輸入:

Sunny = 1, Rainy = 2, Cloudy = 3.
m=np.zeros(150).reshape(50,3) m[0]=[0,0,1] ndays = 50 Y=[0]*ndays u = np.random.uniform(0,1,50) for i in range(1, ndays): tmp=[] m[i] = m[i-1].dot(P) if u[i] < m[i][0]: Y[i]=1 elif u[i] < m[i][0] + m[i][1]: Y[i] = 2 else: Y[i] = 3

如果我用圖表來繪制隨機(jī)過程,將會得到以下類似的結(jié)果:


馬爾可夫鏈你知道多少?Python可視化解析MCMC

在這個過程中比較有趣的是,如果計算這些概率分布中列表的平均值(每個t值對應(yīng)一個),我們將會得到:

[np.mean(m[:,0]), np.mean(m[:,1]), np.mean(m[:,2])] Output: [0.3239190123456788, 0.2888770370370369, 0.3872039506172838]


這近似于不變分布,它可以進(jìn)行如下的計算:

a=np.array([[-0.5, 0.45, 0.1], [0.15, -0.55, 0.3], [1,1,1]]) b=np.array([0,0,1]) mu = np.linalg.solve(a, b) mu Output: array([0.33777778, 0.29333333, 0.36888889])

因此,我們從一個概率分布中創(chuàng)建了一個隨機(jī)樣本,而這個概率分布等于馬爾可夫鏈的不變分布。如果我們認(rèn)為這個分布等于目標(biāo)分布(要記住,很難從中取樣),那么就找到了繞過這個問題的辦法。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI