您好,登錄后才能下訂單哦!
這篇文章主要介紹R、Python中第一次都不會(huì)安裝的包有哪些,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
計(jì)算機(jī)環(huán)境
|---OS:win10/64 bit
|---R語言:R 3.3.3/64 bit
|---Python:Python 3.6.0/64 bit
R語言包
根據(jù)我自己的實(shí)踐以及一些網(wǎng)友的虛心詢問,目前為止,我覺得R語言中最最臭名昭著的一個(gè)包莫過于中文分詞包——Rwordseg,當(dāng)然了還有其它的包(比如結(jié)巴分詞包jiebaR)。因?yàn)檫@個(gè)包需要使用rJava 調(diào)用 Java 分詞工具 Ansj,意味著我們需要安裝并且配置java環(huán)境(也就是jdk)。
下面小小的介紹一下這個(gè)包吧:Rwordseg 是一個(gè)R環(huán)境下的中文分詞工具,使用 rJava 調(diào)用 Java 分詞工具 Ansj。Ansj 也是一個(gè)開源的 Java 中文分詞工具,基于中科院的 ictclas 中文分詞算法, 采用隱馬爾科夫模型(Hidden Markov Model, HMM)。這個(gè)包的作者孫健重寫了一個(gè)Java版本, 并且全部開源,使得 Ansi 可用于人名識(shí)別、地名識(shí)別、組織機(jī)構(gòu)名識(shí)別、多級(jí)詞性標(biāo)注、 關(guān)鍵詞提取、指紋提取等領(lǐng)域,支持行業(yè)詞典、 用戶自定義詞典。So,這個(gè)包很強(qiáng)大。
我自己總結(jié)的安裝方法如下(僅供參考):
去java官網(wǎng)下載jdk,安裝;
新建系統(tǒng)變量JAVA_HOME;變量值為jdk的路徑比如我習(xí)慣性的路徑:D:\Program Files\Java\jdk1.7.0_79;
在PATH變量后加入:%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;末尾最好有分號(hào),防止下次加時(shí)漏掉分號(hào),養(yǎng)成好習(xí)慣;
在命令行窗口輸入javac,會(huì)出現(xiàn)相關(guān)目錄表示配置成功。
R命令install.packages(rjava),應(yīng)該就能安裝成功了
前面幾篇關(guān)于文本分詞的文章就用到了這個(gè)包:rjava、Rwordseg和wordcloud(詞云包),這里列出來:
文章一——《人民的名義》小說文本分析
文章二——R語言文本挖掘朱自清寫《匆匆》時(shí)的情感狀態(tài)
文章三——Python簡單文本分析朱自清寫《匆匆》的情感狀態(tài)
這還只是把rjava安裝完了,主要包Rwordseg好像好多人安裝不了,確實(shí)是這樣,我把它放到百度云里面了,在后臺(tái)回復(fù):Rwordseg可以獲得分享鏈接。下載后放到安裝目錄library文件夾下面,如果前面妥了,應(yīng)該就妥了!當(dāng)然,如果你的計(jì)算機(jī)可以直接安裝那就再好不過!
Python包
由于Python各種包的復(fù)雜依賴性,有時(shí)候安裝一個(gè)包可能需要好多其它包,因?yàn)檫@個(gè)包調(diào)用了其它包的模塊或者函數(shù)。Python里面的難裝的包我遇到的有兩個(gè),爬蟲包——scrapy與科學(xué)計(jì)算包——scipy,下面分別說明:
Python包的下載地址,所有的包都在里面
http://www.lfd.uci.edu/~gohlke/pythonlibs/
scrapy
簡單介紹一下:scrapy是Python開發(fā)的一個(gè)快速,高層次的屏幕抓取和web抓取框架,用于抓取web站點(diǎn)并從頁面中提取結(jié)構(gòu)化的數(shù)據(jù)。Scrapy用途廣泛,可以用于數(shù)據(jù)挖掘、監(jiān)測(cè)和自動(dòng)化測(cè)試。
這里介紹一下它的安裝過程,在Python3系列版本上安裝它確實(shí)費(fèi)了很多人很大的勁,浪費(fèi)了時(shí)間和精力。
親測(cè)在我的計(jì)算機(jī)環(huán)境Python3.6.0上只需兩步:
1、安裝Twisted
(1)、下載到本地
下載地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
注意下載的版本,(我的是):
Twisted-17.1.0-cp36-cp36m-win_amd64
注意:這里的cp36表示python是python3.6.0版本的,win_amd64表示python為64位的,下載下來的是.whl文件。
(2)、命令行執(zhí)行
假設(shè)下載到桌面:path = C:\\User\\26015\\Desktop\\...
path為下載的物理路徑,命令行cmd輸入:
>pip install path
一般情況下,Twisted應(yīng)該就安裝成功了
2、安裝scrapy
>pip install scrapy
在命令行輸入>scrapy一般情況這個(gè)包就成功安裝了!
scipy
簡單介紹一下:scipy包包含致力于科學(xué)計(jì)算中常見問題的各個(gè)工具箱。它的不同子模塊相應(yīng)于不同的應(yīng)用。像插值,積分,優(yōu)化,圖像處理,,特殊函數(shù)等等。它依賴于numpy這個(gè)包,這是個(gè)科學(xué)計(jì)算關(guān)于矩陣計(jì)算包,功能強(qiáng)大。安裝它主要分為一下兩步:
安裝numpy
去前面給的那個(gè)網(wǎng)址里面下載numpy包,這個(gè)包有一百多M,可能下載比較慢,假設(shè)下載本地路徑為path。還是注意:這里的cp36表示python是python3.6系列版本的,win_amd64表示python為64位的,下載下來的時(shí)whl文件。cmd執(zhí)行:
>pip install path
安裝scipy
同上
以上是“R、Python中第一次都不會(huì)安裝的包有哪些”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。