溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python為什么需要Pandas的DataFrame類型

發(fā)布時(shí)間:2021-09-07 10:12:22 來(lái)源:億速云 閱讀:109 作者:chen 欄目:大數(shù)據(jù)

本篇內(nèi)容主要講解“Python為什么需要Pandas的DataFrame類型”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“Python為什么需要Pandas的DataFrame類型”吧!

1. 問(wèn)題描述

假設(shè)現(xiàn)在有這樣的一個(gè)需求,需要在某電影網(wǎng)站上采集基本的電影數(shù)據(jù),字段有電影名稱、電影URL連接地址以及電影的評(píng)分三個(gè)字段。試想一下應(yīng)該選擇什么樣的數(shù)據(jù)類型來(lái)存儲(chǔ)這些數(shù)據(jù)?

Python為什么需要Pandas的DataFrame類型

首先大家可能想到的是list()類型,很快就會(huì)寫(xiě)出下面的代碼:

videos = []item = ['哪吒之魔童降世', 'http://www.videos.com', '9.9']videos.append(item)
# [['哪吒之魔童降世', 'http://www.videos.com', '9.9']]

雖然能夠存儲(chǔ)這些數(shù)據(jù),但是想要基于這些數(shù)據(jù)進(jìn)行某些查找和修改操作,將會(huì)變得非常麻煩,如按評(píng)分排序、超找包含特定關(guān)鍵字的記錄等。對(duì)于numpy.ndarray()來(lái)說(shuō),也是面臨同樣的問(wèn)題。

上面介紹的這種形式的數(shù)據(jù),是一種常見(jiàn)的需要存儲(chǔ)和進(jìn)行處理的一些數(shù)據(jù),但是list()和numpy.ndarray()都無(wú)法很好的處理這些數(shù)據(jù),因此需要一種新的、更加方便的數(shù)據(jù)類型,而這種數(shù)據(jù)類型就是pandas給我們提供的DataFrame類型。

2. Pandas的DataFrame類型

 

Pandas是Python開(kāi)發(fā)中常用的第三方庫(kù),DataFrame是其中最常用的數(shù)據(jù)類型,是一種存放數(shù)據(jù)的容器。而在python中存放數(shù)據(jù)常見(jiàn)的有l(wèi)ist()以及numpy中功能更加強(qiáng)大的numpy.ndarray(),但是為什么還要使用DataFrame呢?


 
首先編寫(xiě)采集電影基本數(shù)據(jù)的代碼:
 
df = pandas.DataFrame(columns=['video_name', 'video_url', 'video_score'])for i in range(1,112):    url = 'https://www.meiju.net/search.php?page={}&searchtype=5&tid=2'.format(i)    soup = BeautifulSoup(requests.get(url).content, 'html.parser')    for item in soup.select('div.hy-video-list li > a'):        row = edict()        row.video_name = item['title']        row.video_url = item['href']                score_tag = item.select_one('span.score')        if score_tag is not None:            row.video_score = score_tag.text                df = df.append(row, ignore_index=True)
 
 
 

有了DataFrame這個(gè)類型之后,我們可以做什么呢?

可以按照評(píng)分對(duì)數(shù)據(jù)進(jìn)行快速排序:

df.sort_values('video_score', ascending=False)

Python為什么需要Pandas的DataFrame類型

除了上面介紹的之外,還有很多更加強(qiáng)大的功能和方法,后續(xù)文章將根據(jù)一些案例持續(xù)進(jìn)行介紹。

3. 結(jié)語(yǔ)

本文介紹了用Pandas的DataFrame類型來(lái)存儲(chǔ)電影數(shù)據(jù)集的數(shù)據(jù),并介紹了DataFrame提供的非常方便的數(shù)據(jù)操作。  

到此,相信大家對(duì)“Python為什么需要Pandas的DataFrame類型”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI