溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Pandas實(shí)用的技巧分享

發(fā)布時(shí)間:2021-08-22 21:57:31 來源:億速云 閱讀:150 作者:chen 欄目:編程語言

這篇文章主要講解了“Pandas實(shí)用的技巧分享”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“Pandas實(shí)用的技巧分享”吧!

01 使用apply拆分文本

Pandas 中 apply 函數(shù),應(yīng)用廣泛,今天要跟大家分享一個(gè)使用的技巧,使用 apply 將 dataframe 中內(nèi)容為 list 的列拆分為多列。

拆分前的數(shù)據(jù)情況,如下圖紅色標(biāo)注所示:

Pandas實(shí)用的技巧分享

拆分后,如下圖所示:

Pandas實(shí)用的技巧分享

這個(gè)案例中,Lemon 使用的數(shù)據(jù)來自 akshare ,在開始前,引入相關(guān) package :

# -*- coding: utf-8 -*-  """  @Author: Lemon  @出品:Python數(shù)據(jù)之道  @Homepage: liyangbit.com  """  import numpy as np  import pandas as pd  import akshare as ak

Lemon 使用的幾個(gè) Python 庫的版本信息如下:

print('numpy版本:{}'.format(np.__version__))  print('pandas版本:{}'.format(pd.__version__))  print('akshare版本:{}'.format(ak.__version__)) # numpy版本:1.18.1  # pandas版本:1.0.3  # akshare版本:0.7.53

如果代碼運(yùn)行出現(xiàn)問題,請先檢查下這幾個(gè)Python庫的版本是否與上面的一致

先從 akshare 獲取需要的數(shù)據(jù),分為兩步,第一步是獲取基金代碼的列表,如下:

df = ak.fund_em_fund_name().head(20).tail(5)  dfdf = df[['基金代碼','基金簡稱']]  print(df)

第二步是獲取基金凈值數(shù)據(jù)和凈值日期,通過一個(gè)自定義函數(shù)來獲取,自定義函數(shù)如下:

# 自定義函數(shù)只有一個(gè)參數(shù)的情形  # 獲取基金單位凈值以及凈值日期  def get_mutual_fund(code):      df = ak.fund_em_open_fund_info(fund=code, indicator="單位凈值走勢")      dfdf = df[['凈值日期', '單位凈值','日增長率']]      # df.columns = ['凈值日期', '單位凈值', 'equityReturn', 'unitMoney']      df['凈值日期'] = pd.to_datetime(df['凈值日期'])      dfdf = df.sort_values('凈值日期',ascending=False)      unit_equity = df.head(1)['單位凈值'].values[0]      date_latest = df.head(1)['凈值日期'].values[0]      return [unit_equity, date_latest]

對于這個(gè)自定義函數(shù),在 pandas 使用 apply 來應(yīng)用自定義函數(shù),這是使用 apply 的一種常用的方法,如下:

# 獲取基金最新的單位凈值和凈值日期  df['tmp'] = df['基金代碼'].apply(get_mutual_fund)  print(df)

獲取的數(shù)據(jù)截圖如下:

Pandas實(shí)用的技巧分享

文本拆分

上圖中的 tmp 列,就是我們這次需要進(jìn)行處理的對象。

處理方法可以有多種,這里 Lemon 使用 pandas 中的 apply 來處理,相對來說,也是比較便捷的方式。

在 apply 函數(shù)中,使用 pd.Series 就可以達(dá)到我們的目的。

# 將單位凈值和凈值日期單獨(dú)成列  df[['最新單位凈值','凈值日期']] = df['tmp'].apply(pd.Series)  dfdf = df.drop('tmp',axis=1)  print(df)

結(jié)果如下:

Pandas實(shí)用的技巧分享

02 有兩個(gè)參數(shù)的函數(shù)

pandas 中的 apply 函數(shù)應(yīng)用自定義函數(shù)時(shí),通常情況下,都是沒有參數(shù)或者一個(gè)參數(shù),那么如果有兩個(gè)參數(shù),是否還可以使用apply函數(shù)呢?

答案是可以的。

這里我們也來探討下。

還是以上面的案例為基礎(chǔ)雛形,同樣的,先從 akshare 獲取數(shù)據(jù)

df1 = ak.fund_em_fund_name().head(20).tail(5)  df1df1 = df1[['基金代碼','基金簡稱']]

接下來,自定義一個(gè)帶有兩個(gè)參數(shù)的函數(shù),如下:

# 自定義函數(shù)有兩個(gè)參數(shù)的情形  # 獲取年度年底基金凈值數(shù)據(jù)  def get_mutual_fund_year(code,year):      year = str(year)      df = ak.fund_em_open_fund_info(fund=code, indicator="單位凈值走勢")      dfdf = df[['凈值日期', '單位凈值', '日增長率']]      # df.columns = ['凈值日期', '單位凈值', 'equityReturn', 'unitMoney']      df['凈值日期'] = pd.to_datetime(df['凈值日期'])     dfdf = df.sort_values('凈值日期',ascending=False)      dfdf = df.set_index('凈值日期')[year]     dfdf = df.reset_index()      unit_equity = df.head(1)['單位凈值'].values[0]      date = df.head(1)['凈值日期'].values[0]      return [unit_equity,date]

帶有兩個(gè)參數(shù)的自定義函數(shù)

然后,使用 apply 來應(yīng)用上面這個(gè)帶兩個(gè)參數(shù)的自定義函數(shù),核心要點(diǎn)就是嵌套使用 lambda 函數(shù),固定其中一個(gè)參數(shù),具體如下

df1['tmp'] = df1['基金代碼'].apply(lambda code: get_mutual_fund_year(code, 2019))

后續(xù),依舊是文本拆分,實(shí)現(xiàn)代碼如下:

# 將單位凈值和凈值日期單獨(dú)成列  df1[['最新單位凈值','凈值日期']] = df1['tmp'].apply(pd.Series)  df1df1 = df1.drop('tmp',axis=1)  print(df1)

應(yīng)用場景

有同學(xué)可能會問,使用兩個(gè)參數(shù)的自定義函數(shù),有什么用呢?

這里,Lemon 也分享一個(gè)應(yīng)用場景:

根據(jù)上面的基礎(chǔ)雛形數(shù)據(jù),針對具體的年度,建立一個(gè)下拉列表,選擇不同的年份時(shí),返回不同年份的結(jié)果,包括文本數(shù)據(jù)、表格數(shù)據(jù)以及圖表等。

效果如下:

Pandas實(shí)用的技巧分享

涉及到一些個(gè)人的數(shù)據(jù),就沒有完整展示啦~~

感謝各位的閱讀,以上就是“Pandas實(shí)用的技巧分享”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對Pandas實(shí)用的技巧分享這一問題有了更深刻的體會,具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識點(diǎn)的文章,歡迎關(guān)注!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI