溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦

發(fā)布時(shí)間:2022-03-01 09:12:33 來源:億速云 閱讀:478 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下Python Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

異常描述

有時(shí)我們的Excel有一個(gè)調(diào)整過自定義格式的日期字段:

Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦

當(dāng)我們用pandas讀取時(shí)卻是這樣的效果:

Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦

不管如何指定參數(shù)都無效。

出現(xiàn)原因

沒有使用系統(tǒng)內(nèi)置的日期單元格格式,自定義格式?jīng)]有對(duì)負(fù)數(shù)格式進(jìn)行定義,pandas讀取時(shí)無法識(shí)別出是日期格式,而是讀取出單元格實(shí)際存儲(chǔ)的數(shù)值。

Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦

解決方案:修改自定義格式

可以修改為系統(tǒng)內(nèi)置的自定義格式:

Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦

或者在自定義格式上補(bǔ)充負(fù)數(shù)的定義:

Python?Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦

增加;@即可

pandas直接解析Excel數(shù)值為日期

有時(shí)這種Excel很多,我們需要通過pandas批量讀取,挨個(gè)人工修改Excel的自定義格式費(fèi)時(shí)費(fèi)力,下面我演示如何使用pandas直接解析這些數(shù)值成為日期格式。

excel中常規(guī)格式和日期格式的轉(zhuǎn)換規(guī)則如下:

1900/1/1為起始日期,轉(zhuǎn)換的數(shù)字是1,往后的每一天增加1

1900/1/2轉(zhuǎn)換為數(shù)字是 2

1900/1/3轉(zhuǎn)換為數(shù)字是 3

1900/1/4轉(zhuǎn)換為數(shù)字是 4

以此類推

excel中時(shí)間轉(zhuǎn)換規(guī)則如下:

在時(shí)間中的規(guī)則是把1天轉(zhuǎn)換為數(shù)字是 1

每1小時(shí)就是 1/24

每1分鐘就是 1/(24×60)=1/1440

每1秒鐘就是 1/(24×60×60)=1/86400

根據(jù)Excel的日期存儲(chǔ)規(guī)則,我們只需要以1900/1/1為基準(zhǔn)日期,根據(jù)數(shù)值n偏移n-1天即可得到實(shí)際日期。不過還有個(gè)問題,Excel多存儲(chǔ)了1900年2月29日這一天,而正常的日歷是沒有這一天的,而我們的日期又都是大于1900年的,所以應(yīng)該偏移n-2天,干脆使用1899年12月30日作為基準(zhǔn),這樣不需要作減法操作。

解析代碼如下:

import pandas as pd
from pandas.tseries.offsets import Day

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.apply(lambda x: f"{x.month}月{x.day}日")
df.head()
 日期
06月8日
16月9日
26月10日
36月11日
46月12日

如果需要調(diào)用time的strftime方法,由于包含中文則需要設(shè)置locale:

import pandas as pd
from pandas.tseries.offsets import Day
import locale
locale.setlocale(locale.LC_CTYPE, 'chinese')

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.dt.strftime('%Y年%m月%d日')
df.head()
 日期
02021年06月08日
12021年06月09日
22021年06月10日
32021年06月11日
42021年06月12日

看完了這篇文章,相信你對(duì)“Python Pandas讀取Excel日期數(shù)據(jù)的異常處理怎么辦”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI