<table id="ijeih"></table>

<b id="ijeih"></b>

<div id="ijeih"><progress id="ijeih"></progress></div>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Python中怎么檢驗時間序列的平穩(wěn)性

發(fā)布時間：2021-07-05 18:00:59 來源：億速云閱讀：821 作者：Leah 欄目：編程語言

Python中怎么檢驗時間序列的平穩(wěn)性，很多新手對此不是很清楚，為了幫助大家解決這個難題，下面小編將為大家詳細講解，有這方面需求的人可以來學(xué)習(xí)下，希望你能有所收獲。

首先我們還是來簡單介紹一下平穩(wěn)性檢驗的相關(guān)概念。

Python中怎么檢驗時間序列的平穩(wěn)性

圖1. 平穩(wěn)性序列的相關(guān)公式

時間序列的平穩(wěn)性可分為嚴平穩(wěn)和寬平穩(wěn)。設(shè){Xt}是一時間序列，對任意正整數(shù)m，任取t1、t2、t3、...、tm∈T，對任意整數(shù)τ，假如滿足圖1中式（1），則稱時間序列{Xt}是嚴平穩(wěn)時間序列。而寬平穩(wěn)的定義為，如果{Xt}滿足以下三個條件：

（1）任取t∈T，有E(Xt·Xt)<∞；

（2）任取t∈T，有E Xt =μ，μ為常數(shù)；

（3）任取t，s，k∈T，且k+s-t∈T，有γ(t, s)=γ(k, k+s-t)

則稱{Xt}為寬平穩(wěn)時間序列。

因為實際應(yīng)用中我們很難獲得隨機序列的分布函數(shù)，所以嚴平穩(wěn)用得極少，主要是使用寬平穩(wěn)時間序列。

在了解了平穩(wěn)性的基本概念之后，我們再來說一下平穩(wěn)時間序列的意義。平穩(wěn)時間序列的分析也遵循數(shù)理統(tǒng)計學(xué)的基本原理，都是利用樣本信息來推測總體信息。這就要求分析的隨機變量越少越好（也就是數(shù)據(jù)的維度越小越好），而每個變量獲得樣本信息越多越好（也就是數(shù)據(jù)的觀測值越大越好），因為隨機變量越少，分析過程越簡單，樣本容量越大，分析的結(jié)果越可靠。但時間序列的數(shù)據(jù)結(jié)構(gòu)有其特殊性，它在任意時刻t的序列值Xt都是一個隨機變量，而且由于時間的不可重復(fù)性，該變量在任意一個時刻只能獲得唯一的樣本觀測值。由于樣本信息太少，如果沒有其他的輔助信息，這種數(shù)據(jù)結(jié)構(gòu)通常是沒有辦法分析的，但序列平穩(wěn)性就可以有效解決這個問題。在平穩(wěn)序列中，序列的均值等于常數(shù)就意味著原本含有可列多個隨機變量的均值序列{μt, t∈T}變成了一個常數(shù)序列{μ, t∈T}，原本每個隨機變量的均值μt只能依靠唯一的一個樣本觀察值xt去估計，現(xiàn)在由于μt=μ，于是每一個樣本觀察值xt，都變成了常數(shù)均值的樣本觀察值，如圖1中式（2）所示。這就極大減少了隨機變量的個數(shù)，并增加了待估參數(shù)的樣本容量，這也就降低了時序分析的難度。

在了解了時間序列的平穩(wěn)性之后，我們再來詳細講解一下如何用python來進行檢驗。

用python來進行平穩(wěn)性檢驗主要有3種方法，分別是時序圖檢驗、自相關(guān)圖檢驗以及構(gòu)造統(tǒng)計量進行檢驗。

首先來說時序圖檢驗，時序圖就是普通的時間序列圖，即以時間為橫軸，觀察值為縱軸進行檢驗。這里筆者給出3個例子，因為時序圖過于簡單，所以筆者在這里直接用Excel作時序圖，用python也可以，不過沒有Excel簡單。第一個例子是1964-1999年中國紗年產(chǎn)量時間序列（該數(shù)據(jù)來自北京統(tǒng)計局），其數(shù)據(jù)如圖2所示，序列圖如圖3所示。圖3中明顯可以看出，中國紗年產(chǎn)量序列有明顯的遞增趨勢，所以它一定不是平穩(wěn)序列。

Python中怎么檢驗時間序列的平穩(wěn)性

圖2. 紗產(chǎn)量部分數(shù)據(jù)截圖

Python中怎么檢驗時間序列的平穩(wěn)性

圖3. 紗產(chǎn)量時序圖

第二個例子是1962年1月至1975年12月平均每頭奶牛月產(chǎn)奶量時間序列（數(shù)據(jù)來自網(wǎng)站http://census-info.us），其數(shù)據(jù)如圖4所示，序列圖如圖5所示。從圖5中可以看出，平均每頭奶牛的月產(chǎn)奶量以年為周期呈規(guī)則的周期性，此外還有明顯的逐年遞增趨勢，所以該序列也一定不是平穩(wěn)序列。

Python中怎么檢驗時間序列的平穩(wěn)性

圖4. 奶牛產(chǎn)量部分數(shù)據(jù)截圖

Python中怎么檢驗時間序列的平穩(wěn)性

圖5. 奶牛產(chǎn)量時序圖

第三個例子是1949年至1998年北京市每年最高氣溫序列（數(shù)據(jù)來自北京市統(tǒng)計局），其數(shù)據(jù)如圖6所示，序列圖如圖7所示。從圖7中可以看出，北京市每年的最高氣溫始終圍繞在37度附近隨機波動，沒有明顯趨勢或周期，基本可以視為平穩(wěn)序列，但我們還需要利用自相關(guān)圖進一步驗證。

Python中怎么檢驗時間序列的平穩(wěn)性

圖6. 北京最高氣溫部分數(shù)據(jù)截圖

Python中怎么檢驗時間序列的平穩(wěn)性

圖7. 北京最高氣溫時序圖

從上面的例子可以看出，時序圖只能粗略來判斷一個時間序列是否為平穩(wěn)序列，我們可以用自相關(guān)圖來更進一步檢驗。要畫自相關(guān)圖，我們就要用到python，下面是相關(guān)代碼。

import pandas as pd  import matplotlib.pyplot as plt  from statsmodels.graphics.tsaplots import plot_acf  temperature = r'C:\Users\北京氣溫.xls'  milk = r'C:\Users\奶牛產(chǎn)量.xlsx'  yarn = r'C:\Users\紗產(chǎn)量.xls'  data_tem = pd.read_excel(temperature, parse_date=True)  data_milk = pd.read_excel(milk, parse_date=True)  data_yarn = pd.read_excel(yarn, parse_date=True)  plt.rcParams.update({'figure.figsize':(8,6), 'figure.dpi':100}) #設(shè)置圖片大小  plot_acf(data_tem.Tem) #生成自相關(guān)圖  plot_acf(data_milk.milk_yield)  plot_acf(data_yarn.yarn_yield)  plt.show()

畫自相關(guān)圖用到的是statsmodels中的plot_acf方法，這個方法很簡單，只需要直接輸入數(shù)據(jù)即可，不過數(shù)據(jù)要是一維的，生成的3張圖如圖8、圖9和圖10所示。

Python中怎么檢驗時間序列的平穩(wěn)性

圖8. 紗產(chǎn)量自相關(guān)圖

Python中怎么檢驗時間序列的平穩(wěn)性

圖9. 奶牛產(chǎn)量自相關(guān)圖

Python中怎么檢驗時間序列的平穩(wěn)性

圖10. 北京最高氣溫自相關(guān)圖

平穩(wěn)序列通常具有短期相關(guān)性，即隨著延遲期數(shù)k的增加，平穩(wěn)序列的自相關(guān)系數(shù)會很快地衰減向零，而非平穩(wěn)序列的自相關(guān)系數(shù)的衰減速度會比較慢，這就是我們利用自相關(guān)圖判斷平穩(wěn)性的標準。我們就來看下這3張自相關(guān)圖，圖8是紗年產(chǎn)量的自相關(guān)圖，其橫軸表示延遲期數(shù)，縱軸表示自相關(guān)系數(shù)，從圖中可以看出自相關(guān)系數(shù)衰減到零的速度比較緩慢，在很長的延遲期內(nèi)，自相關(guān)系數(shù)一直為正，然后為負，呈現(xiàn)出三角對稱性，這是具有單調(diào)趨勢的非平穩(wěn)序列的一種典型的自相關(guān)圖形式。再來看看圖9，這是每頭奶牛的月產(chǎn)奶量的自相關(guān)圖，圖中自相關(guān)系數(shù)長期位于零軸一邊，這是具有單調(diào)趨勢序列的典型特征，同時還呈現(xiàn)出明顯的正弦波動規(guī)律，這是具有周期變化規(guī)律的非平穩(wěn)序列的典型特征。最后再來看下圖10，這是北京每年最高氣溫的自相關(guān)圖，圖中顯示該序列的自相關(guān)系數(shù)一直比較小，可以認為該序列一直在零軸附近波動，這是隨機性較強的平穩(wěn)序列通常具有的自相關(guān)圖。

最后我們再講一下ADF方法。前面兩種方法都是作圖，圖的特點是比較直觀，但不夠精確，而ADF法則是直接通過假設(shè)檢驗的方式來驗證平穩(wěn)性。ADF（全稱Augmented Dickey-Fuller）是一種單位根檢驗方法，單位根檢驗方法比較多，而ADF法是比較常用的一種，其和普通的假設(shè)檢驗沒有太大區(qū)別，都是列出原假設(shè)和備擇假設(shè)。ADF的原假設(shè)（H0）和備擇假設(shè)（H1）如下。

H0：具有單位根，屬于非平穩(wěn)序列。

H1：沒有單位根，屬于平穩(wěn)序列，說明這個序列不具有時間依賴型結(jié)構(gòu)。

下面我們就用python代碼來解釋一下ADF的用法。

from statsmodels.tsa.stattools import adfuller  yarn_result = adfuller(data_yarn.yarn_yield) #生成adf檢驗結(jié)果  milk_result = adfuller(data_milk.milk_yield)  tem_result = adfuller(data_tem.Tem)  print('The ADF Statistic of yarn yield: %f' % yarn_result[0])  print('The p value of yarn yield: %f' % yarn_result[1])  print('The ADF Statistic of milk yield: %f' % milk_result[0])  print('The p value of milk yield: %f' % milk_result[1])  print('The ADF Statistic of Beijing temperature: %f' % tem_result[0])  print('The p value of Beijing temperature: %f' % tem_result[1])

這里我們用的是statsmodels中的adfuller方法，其使用也比較簡單，直接輸入數(shù)據(jù)即可，但其返回值較多，返回的結(jié)果中共有7個值，分別是adf、pvalue、usedlag、nobs、critical values、icbest和resstore，這7個值的意義大家可以參考官方文檔，我們這里用到的是前兩個，即adf和pvalue，adf就是ADF方法的檢驗結(jié)果，而pvalue就是我們常用的p值。我們的得到結(jié)果如圖11所示。

Python中怎么檢驗時間序列的平穩(wěn)性

看完上述內(nèi)容是否對您有幫助呢？如果還想對相關(guān)知識有進一步的了解或閱讀更多相關(guān)文章，請關(guān)注億速云行業(yè)資訊頻道，感謝您對億速云的支持。

向AI問一下細節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
pip自動生成和安裝requirements.txt的方法
下一篇新聞：
什么是Mysql存儲引擎

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<table id="pgdpc"><dfn id="pgdpc"><form id="pgdpc"></form></dfn></table>