溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python數(shù)據(jù)分析Numpy中常用相關(guān)性函數(shù)是什么

發(fā)布時(shí)間:2022-06-02 10:54:40 來(lái)源:億速云 閱讀:281 作者:zzz 欄目:開(kāi)發(fā)技術(shù)

今天小編給大家分享一下Python數(shù)據(jù)分析Numpy中常用相關(guān)性函數(shù)是什么的相關(guān)知識(shí)點(diǎn),內(nèi)容詳細(xì),邏輯清晰,相信大部分人都還太了解這方面的知識(shí),所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來(lái)了解一下吧。

摘要:

NumPy中包含大量的函數(shù),這些函數(shù)的設(shè)計(jì)初衷是能更方便地使用,掌握解這些函數(shù),可以提升自己的工作效率。這些函數(shù)包括數(shù)組元素的選取和多項(xiàng)式運(yùn)算等。

前述通過(guò)對(duì)某公司股票的收盤價(jià)的分析,了解了某些Numpy的一些函數(shù)。通常實(shí)際中,某公司的股價(jià)被另外一家公司的股價(jià)緊緊跟隨,它們可能是同領(lǐng)域的競(jìng)爭(zhēng)對(duì)手,也可能是同一公司下的不同的子公司??赡芤騼杉夜窘?jīng)營(yíng)的業(yè)務(wù)類型相同,面臨同樣的挑戰(zhàn),需要相同的原料和資源,并且爭(zhēng)奪同類型的客戶。

實(shí)際中,有很多這樣的例子,如果要檢驗(yàn)一下它們是否真的存在關(guān)聯(lián)。一種方法就是看看兩個(gè)公司股票收益率的相關(guān)性,強(qiáng)相關(guān)性意味著它們之間存在一定的關(guān)聯(lián)性(特別是當(dāng)所用的數(shù)據(jù)不夠充足時(shí),誤差可能更大)

一、股票相關(guān)性分析

1、導(dǎo)出兩個(gè)相關(guān)的股票數(shù)據(jù)():

Python數(shù)據(jù)分析Numpy中常用相關(guān)性函數(shù)是什么

2、分別從CSV文件中讀入相關(guān)數(shù)據(jù)

close = np.loadtxt('data036.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)
new_close = np.loadtxt('data999.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)

3、協(xié)方差描述的是兩個(gè)變量共同變化的趨勢(shì),其實(shí)就是歸一化前的相關(guān)系數(shù)。使用 cov 函數(shù)計(jì)算股票收益率的協(xié)方差矩陣,完整代碼如下:

import numpy as np
from datetime import datetime
import matplotlib.pyplot as plt
def datestr2num(s): #定義一個(gè)函數(shù)
    return datetime.strptime(s.decode('ascii'),"%Y-%m-%d").date().weekday()
close=np.loadtxt('data036.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True) #導(dǎo)入data036.csv數(shù)據(jù) 
new_close=np.loadtxt('data999.csv',delimiter=',', usecols=(5,),converters={1:datestr2num},unpack=True)#導(dǎo)入data999.csv數(shù)據(jù)
covariance = np.cov(close,new_close) #使用numpy.cov() 函數(shù)計(jì)算兩個(gè)數(shù)列的協(xié)方差矩陣
print(close.mean()) #求close的平均值
print(new_close.mean())#求new_close的平均值
print('covariance:','\n',covariance)

運(yùn)行結(jié)果:

48.40690476190476
18.85157142857143
covariance: 
 [[30.46934553  1.5201865 ]
 [ 1.5201865   8.96031113]]

1)用 diagonal 函數(shù)查看矩陣對(duì)角線上的元素

print ("對(duì)角元素:", covariance.diagonal()) # diagonal查看對(duì)角上的元素

運(yùn)行結(jié)果:

對(duì)角元素: [30.46934553  8.96031113]

2)使用 trace 函數(shù)計(jì)算矩陣的跡,即對(duì)角線上元素之和

print("Covariance trace", covariance.trace()) #對(duì)角線上元素之和

3)兩個(gè)向量的相關(guān)系數(shù)被定義為協(xié)方差除以各自標(biāo)準(zhǔn)差的乘積。計(jì)算向量 a 和 b 的相關(guān)系數(shù)的公式:corr(a,b)=cov(a,b)/(std(a)*std(b))

covar = covariance/ (np.std(close) * np.std(new_close))
print("相關(guān)系數(shù)矩陣:", covar)

運(yùn)行結(jié)果:

相關(guān)系數(shù)矩陣: [[1.84843969 0.09222295]
 [0.09222295 0.54358223]]

注意:由于covariance是一個(gè)矩陣,因而得到的covar也是一個(gè)矩陣

相關(guān)系數(shù)是兩只股票的相關(guān)程度。相關(guān)系數(shù)的取值范圍在 -1 到 1 之間。根據(jù)定義,一組數(shù)值與自身的相關(guān)系數(shù)等于 1 ,numpy中使用 corrcoef 函數(shù)計(jì)算相關(guān)系數(shù)

closecorr = np.corrcoef(close,new_close)
print("相關(guān)系數(shù):",'\n', closecorr )

運(yùn)行結(jié)果:

相關(guān)系數(shù): 
 [[1.         0.09200338]
 [0.09200338 1.        ]]

對(duì)角線上的元素即close和new_close與自身的相關(guān)系數(shù),因此均為1。相關(guān)系數(shù)矩陣是關(guān)于對(duì)角線對(duì)稱的,因此另外兩個(gè)元素的值相等,表示close和new_close的相關(guān)系數(shù)等于new_close和close的相關(guān)系數(shù)。

判斷兩只股票的價(jià)格走勢(shì)是否同步的要點(diǎn)是,它們的差值偏離了平均差值2倍于標(biāo)準(zhǔn)差的距離,則認(rèn)為這兩只股票走勢(shì)不同步。代碼如下:

difference = close - new_close
avg = np.mean(difference)
dev = np.std(difference)
print ("Out of sync:", np.abs(difference[-1]-avg)>2*dev)

運(yùn)行結(jié)果:

Out of sync: False

二、多項(xiàng)式

微積分里有泰勒展開(kāi),也就是用一個(gè)無(wú)窮級(jí)數(shù)來(lái)表示一個(gè)可微的函數(shù)。實(shí)際上,任何可微的(從而也是連續(xù)的)函數(shù)都可以用一個(gè)N次多項(xiàng)式來(lái)估計(jì),而比N次冪更高階的部分為無(wú)窮小量可忽略不計(jì)。

NumPy中的 ployfit 函數(shù)可以用多項(xiàng)式去擬合一系列數(shù)據(jù)點(diǎn),無(wú)論這些數(shù)據(jù)點(diǎn)是否來(lái)自連續(xù)函數(shù)都適用。

繼續(xù)使用close和new_close的股票價(jià)格數(shù)據(jù)。用一個(gè)三次多項(xiàng)式去擬合兩只股票收盤價(jià)的差價(jià)。

t = np.arange(len(close)) #得到close數(shù)列的長(zhǎng)度
poly = np.polyfit(t, close - new_close, 3) #利用長(zhǎng)度t和兩只股票的價(jià)差,生成一個(gè)三項(xiàng)式,三項(xiàng)式有3個(gè)系數(shù)和一個(gè)常量
print("Polynomial fit", poly)

運(yùn)行結(jié)果:

Polynomial fit: [ 1.61308827e-07 -4.34114354e-04  1.84480028e-01  1.33680483e+01]

用我們剛剛得到的多項(xiàng)式對(duì)象以及 polyval 函數(shù),推斷下一個(gè)差值:

print ("Next value:", np.polyval(poly, t[-1] + 1))  #用生成的多項(xiàng)式擬合求下一個(gè)差值
print(difference[-1]) #打印最后一個(gè)實(shí)際的差值

運(yùn)行結(jié)果:

Next value: 26.222936287829654
26.21

在極限情況下,差值可以在某個(gè)點(diǎn)為0。使用 roots 函數(shù)找出擬合的多項(xiàng)式函數(shù)什么時(shí)候到達(dá)0值:

print( "Roots", np.roots(poly))#root返回多項(xiàng)式的根

運(yùn)行結(jié)果:

Roots [2138.21411788  615.9134063   -62.92728874]

三、求極值的知識(shí)

極值是函數(shù)的最大值或最小值。在高等代數(shù)微積分中,這些極值點(diǎn)位于函數(shù)的導(dǎo)數(shù)為0的位置,然后再求導(dǎo)數(shù)函數(shù)的根,即找出原多項(xiàng)式函數(shù)的極值點(diǎn)。

1)使用 polyder 函數(shù)對(duì)多項(xiàng)式函數(shù)求導(dǎo)

der = np.polyder(poly)
print("Derivative", der)

2)求出導(dǎo)數(shù)函數(shù)的根,即找出原多項(xiàng)式函數(shù)的極值點(diǎn)

print( "Extremas", np.roots(der))

運(yùn)行后即得到如下:

Derivative: [ 4.83926482e-07 -8.68228709e-04  1.84480028e-01]
Extremas [1547.84609151  246.28739879]

3)用 polyval 計(jì)算多項(xiàng)式函數(shù)的值,并用matplotlib顯示

vals = np.polyval(poly, t)
print('vals:',vals)
print('max value:', np.argmax(vals))
print('min value:', np.argmin(vals))
plt.plot(t,difference)
plt.plot(t,vals)
plt.show()

運(yùn)行結(jié)果如下:

Python數(shù)據(jù)分析Numpy中常用相關(guān)性函數(shù)是什么

以上就是“Python數(shù)據(jù)分析Numpy中常用相關(guān)性函數(shù)是什么”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會(huì)為大家更新不同的知識(shí),如果還想學(xué)習(xí)更多的知識(shí),請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI