溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python數(shù)據(jù)分析需要解答的三大問題是什么

發(fā)布時(shí)間:2021-10-25 17:17:12 來源:億速云 閱讀:178 作者:柒染 欄目:編程語言

本篇文章給大家分享的是有關(guān)Python數(shù)據(jù)分析需要解答的三大問題是什么,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

Windows系統(tǒng)并沒有自帶Python工具,需要我們自己搭建環(huán)境。對(duì)于小白,我們推薦大家安裝Anaconda,一個(gè)開源的Python發(fā)行版本,安裝和使用都很方便,還自帶大量工具包,簡(jiǎn)直貼心。

許多小可愛在搭建環(huán)境的時(shí)候沒有按要求來,導(dǎo)致后面出現(xiàn)很多問題不得不花較多時(shí)間精力去解決,很不方便。這里強(qiáng)調(diào)一下兩個(gè)點(diǎn):

1)安裝路徑選擇C盤!

2)如圖兩個(gè)advanced options都要勾選!

Python數(shù)據(jù)分析需要解答的三大問題是什么

此外,雖然Mac系統(tǒng)自帶Python工具,也建議使用Mac系統(tǒng)的初學(xué)小白安一個(gè)Anaconda,會(huì)方便很多~

讀取數(shù)據(jù)報(bào)錯(cuò)應(yīng)對(duì)

首先將EXCEL文件另存為CSV文件,再調(diào)用pandas工具包進(jìn)行讀取。

import numpy as np  
import pandas as pd 
import matplotlib.pyplot as plt
# numpy:科學(xué)計(jì)算工具包
# pandas:數(shù)據(jù)分析工具包
# malplotlib:圖表繪制工具包
# improt語句:加載工具包

data = pd.read_csv("路徑\\地市級(jí)黨委書記數(shù)據(jù)庫(2000-10).csv",encoding = "gbk",engine = 'python')
print(data)

對(duì)于讀取數(shù)據(jù)時(shí)的報(bào)錯(cuò)情況,參考如下解決方案:

1)檢查所有代碼是不是都是英文,特別是標(biāo)點(diǎn)!

#檢查每一處逗號(hào),單雙引號(hào),括號(hào)

2)excel轉(zhuǎn)csv時(shí),可設(shè)置編碼為UTF-8,并更改參數(shù)

encoding = 'utf-8'

3)mac系統(tǒng)導(dǎo)出csv時(shí),可以更改參數(shù) 

encoding = "gb18030"

4)可將文件名改為英文文件名,例如“data.csv”

data.csv

5)設(shè)置engine='python'

engine = 'python'

6)在數(shù)據(jù)量不大的時(shí)候,也可以用read_excel, 代碼則是

data=pd.read_excel(‘路徑.xlsx’)

前提是數(shù)據(jù)放在第一個(gè)sheet;如果是第二個(gè)sheet,代碼改為

data=pd.read_excel(‘路徑.xlsx’, sheet_name=1)

*讀取sheet_name編號(hào)是從0開始的,1代表第二個(gè)sheet

matplotlib中文亂碼

也是很常見也很頭大的問題~這里以win10系統(tǒng),python3.6版本為例講解一下解決步驟:

*部分摘自原答案https://www.zhihu.com/question/25404709/answer/128171562

感謝這位知友:司毅

1)找到matplotlib 配置文件:

import matplotlib 
print(matplotlib.matplotlib_fname()) 
# 示例輸出結(jié)果如下:
# D:\Program Files\Python36\Lib\site-packages\matplotlib\mpl-data

2)編輯器打開此文件 matplotlibrc

刪除font.family和font.sans-serif兩行前的#,并在font.sans-serif后添加微軟雅黑字體Microsoft YaHei

Python數(shù)據(jù)分析需要解答的三大問題是什么

3)下載字體:msyh.ttf (微軟雅黑)放在matplotlib 字體文件夾下:

# D:\Program Files\Python36\Lib\site-packages\matplotlib\mpl-data\fonts\ttf

4)刪除.matplotlib/cache里面的兩個(gè)緩存字體文件

C:\Users\你的用戶名\.matplotlib

5)重啟Python

以上就是Python數(shù)據(jù)分析需要解答的三大問題是什么,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI