<i id="uzfir"><menuitem id="uzfir"></menuitem></i>

<kbd id="uzfir"></kbd>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

用戶(hù)登錄×

賬戶(hù)密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

常用數(shù)據(jù)科學(xué)Python庫(kù)有哪些

發(fā)布時(shí)間：2021-10-20 13:44:13 來(lái)源：億速云閱讀：147 作者：iii 欄目：編程語(yǔ)言

本篇內(nèi)容介紹了“常用數(shù)據(jù)科學(xué)Python庫(kù)有哪些”的有關(guān)知識(shí)，在實(shí)際案例的操作過(guò)程中，不少人都會(huì)遇到這樣的困境，接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧！希望大家仔細(xì)閱讀，能夠?qū)W有所成！

Pandas

Pandas庫(kù)[3]對(duì)于致力于探索性數(shù)據(jù)分析的數(shù)據(jù)科學(xué)家來(lái)說(shuō)是一個(gè)必不可少的庫(kù)。顧名思義，它使用pandas來(lái)分析你的數(shù)據(jù)，或者更具體地說(shuō)，pandas數(shù)據(jù)幀。

以下是一些你可以從HTML報(bào)表中訪(fǎng)問(wèn)和查看的功能：

類(lèi)型推斷
唯一值
缺少值
分位數(shù)統(tǒng)計(jì)(例如，中位數(shù))
描述性統(tǒng)計(jì)
直方圖
相關(guān)性(如皮爾遜)
文本分析

如何安裝?

使用pip：

pip install -U pandas-profiling[notebook] jupyter nbextension enable --py widgetsnbextension  這種方式對(duì)我也很管用：  pip install pandas-profiling import pandas_profiling

例子：

下面是我們可以從profile report功能訪(fǎng)問(wèn)的可視化示例之一?？梢钥吹揭粋€(gè)易于理解的彩色的相關(guān)性可視化圖。

常用數(shù)據(jù)科學(xué)Python庫(kù)有哪些

局限性：

如果有一個(gè)大的數(shù)據(jù)集，這個(gè)概要報(bào)告可能需要相當(dāng)長(zhǎng)的時(shí)間。我的解決方案是要么簡(jiǎn)單地使用較小的數(shù)據(jù)集，要么對(duì)整個(gè)數(shù)據(jù)集進(jìn)行采樣。

NLTK

通常與nltk相關(guān)的術(shù)語(yǔ)是NLP，或者自然語(yǔ)言處理，它是數(shù)據(jù)科學(xué)(和其他學(xué)科)的一個(gè)分支，它更容易地包含對(duì)文本的處理。導(dǎo)入nltk之后，你可以更輕松地分析文本。

以下是你可以使用nltk訪(fǎng)問(wèn)的一些功能：

標(biāo)記化文本(例如，[“標(biāo)記化”，“文本”])
詞性標(biāo)記
詞干提取和詞形還原

如何安裝：

pip install nltk import nltk

例子：

import nltk  thing_to_tokenize = “a long sentence with words”  tokens = nltk.word_tokenize(thing_to_tokenize)  tokens  returns:  [“a”, “l(fā)ong”, “sentence”, “with”, “words”]

我們需分開(kāi)每個(gè)單詞，以便對(duì)其進(jìn)行分析。

在某些情況下需要分隔單詞。然后它們可以被標(biāo)記、計(jì)數(shù)，機(jī)器學(xué)習(xí)算法的新指標(biāo)可以使用這些輸入來(lái)創(chuàng)建預(yù)測(cè)。利用nltk的另一個(gè)有用的特性是文本可以用于情感分析。情感分析在很多企業(yè)中都很重要，尤其是那些有客戶(hù)評(píng)論的企業(yè)?，F(xiàn)在我們討論情感分析，讓我們看看另一個(gè)有助于快速情感分析的庫(kù)。

TextBlob

TextBlob[8]與nltk有很多相同的優(yōu)點(diǎn)，但是它的情感分析功能非常出色。除了分析之外，它還具有利用樸素貝葉斯和決策樹(shù)支持分類(lèi)的功能。

以下是你可以使用TextBlob訪(fǎng)問(wèn)的一些功能：

標(biāo)記化
詞性標(biāo)注
分類(lèi)
拼寫(xiě)更正
情感分析

如何安裝：

pip install textblob  from textblob import TextBlob

例子：

情感分析：

review = TextBlob(“here is a great text blob about wonderful Data Science”)  review.sentiment  returns:  Sentiment(polarity=0.80, subjectivity = 0.44)

正常浮點(diǎn)范圍為[-1.0，1.0]，而積極情感介于[0.0，1.0]之間。

分類(lèi)：

from textblob.classifiers import NaiveBayesClassifier  training_data = [(&lsquo;sentence example good one&rsquo;, &lsquo;pos&rsquo;), (&lsquo;sentence example great two&rsquo;, &lsquo;pos&rsquo;), (&lsquo;sentence example bad three&rsquo;, &lsquo;neg&rsquo;), (&lsquo;sentence example worse four&rsquo;, &lsquo;neg&rsquo;)]  testing_data = [(&lsquo;sentence example good&rsquo;, &lsquo;pos&rsquo;), (&lsquo;sentence example great&rsquo;, &lsquo;pos&rsquo;)]  cl = NaiveBayesClassifier(training_data)

你可以使用這個(gè)分類(lèi)器對(duì)文本進(jìn)行分類(lèi)，該分類(lèi)器將返回“pos”或“neg”輸出。

這些來(lái)自textblob的簡(jiǎn)單代碼提供了非常強(qiáng)大和有用的情感分析和分類(lèi)。

pyLDAvis

另一個(gè)使用NLP的工具是pyLDAvis[10]。它是一個(gè)交互式主題模型可視化工具的庫(kù)。例如，當(dāng)我使用LDA(潛Dirichlet分布)執(zhí)行主題模型時(shí)，我通常會(huì)看到單元格中的主題輸出，這可能很難閱讀。然而當(dāng)它出現(xiàn)在一個(gè)很好的視覺(jué)總結(jié)中時(shí)，它會(huì)更有益，也更容易消化，就像pyLDAvis一樣。

以下是你可以使用pyLDAvis訪(fǎng)問(wèn)的一些功能：

顯示了前30個(gè)最突出的術(shù)語(yǔ)
有一個(gè)交互式調(diào)整器，允許你滑動(dòng)相關(guān)性度量
顯示x軸上的PC1和y軸上的PC2的熱門(mén)主題
顯示與大小對(duì)應(yīng)的主題

總的來(lái)說(shuō)，這是一種讓人印象深刻的主題可視化方式，這是其他任何庫(kù)都無(wú)法做到的。

如何安裝：

pip install pyldavis  import pyldavis

例子：

為了看到最好的例子，這里有一個(gè)Jupyter Notebook[11]參考資料，它展示了這個(gè)數(shù)據(jù)科學(xué)庫(kù)的許多獨(dú)特和有益的特性: https://nbviewer.jupyter.org/github/bmabey/pyLDAvis/blob/master/notebooks/pyLDAvis_overview.ipynb

NetworkX

這個(gè)數(shù)據(jù)科學(xué)包NetworkX[13]，將其優(yōu)勢(shì)集中在生物、社會(huì)和基礎(chǔ)設(shè)施網(wǎng)絡(luò)可視化上。

以下是你可以使用NetworkX訪(fǎng)問(wèn)的一些功能：

創(chuàng)建圖形、節(jié)點(diǎn)和邊
檢驗(yàn)圖的元素
圖結(jié)構(gòu)
圖的屬性
多重圖
圖形生成器和操作

如何安裝：

pip install networkx  import networkx

例子：

創(chuàng)建圖形

import networkx  graph = networkx.Graph()

你可以與其他庫(kù)協(xié)作，例如matplotlib.pyplot也可以創(chuàng)建圖形的可視化(以數(shù)據(jù)科學(xué)家習(xí)慣于看到的方式)。

“常用數(shù)據(jù)科學(xué)Python庫(kù)有哪些”的內(nèi)容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站，小編將為大家輸出更多高質(zhì)量的實(shí)用文章！

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
如何理解keycloak集群化
下一篇新聞：
分享多線(xiàn)程場(chǎng)景下一種可靈活編排的軟件架構(gòu)

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專(zhuān)題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢(xún)

7*24小時(shí)在線(xiàn)電話(huà)：400-100-2938

7*24小時(shí)在線(xiàn) QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼