溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Apache Zeppelin Notebook和R的示例分析

發(fā)布時間:2022-01-14 14:50:28 來源:億速云 閱讀:113 作者:柒染 欄目:云計算

這篇文章主要為大家分析了Apache Zeppelin Notebook和R的示例分析的相關(guān)知識點,內(nèi)容詳細(xì)易懂,操作細(xì)節(jié)合理,具有一定參考價值。如果感興趣的話,不妨跟著跟隨小編一起來看看,下面跟著小編一起深入學(xué)習(xí)“Apache Zeppelin Notebook和R的示例分析”的知識吧。

介紹

小編目的是幫助您開始使用 Apache Zeppelin Notebook,它可以滿足您用R做數(shù)據(jù)科學(xué)的需求。Zeppelin 是一個提供交互數(shù)據(jù)分析且基于Web的筆記本。方便你做出可數(shù)據(jù)驅(qū)動的、可交互且可協(xié)作的精美文檔,并且支持多種語言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等等。而且Zeppelin支持自己重寫各種語言的插件,是很方便擴(kuò)展的。

Apache Zeppelin Notebook和R的示例分析

Apache Zeppelin Notebook和R的示例分析

然而,最新的官方版本是0.5.0,還不支持R編程語言。幸運的是,NFLabs公司做了個開源項目,讓我提供了一個R的編譯器。這個編譯器是讓用戶可以使用自定義的語言做為數(shù)據(jù)處理后端的一個 Zeppelin 插件。例如在 Zeppelin 使用scala代碼,您需要一個 Spark編譯器。所以,如果你像我一樣有足夠的耐心將R集成到Zeppelin中, 這個教程將告訴你怎樣從源碼開始配置 Zeppelin和R。

準(zhǔn)備工作

  • 我們將通過Bash shell在Linux上安裝Zeppelin。如果您使用的是Windows操作系統(tǒng),我建議您安裝和使用Cygwin終端(它提供功能類似于Windows上的Linux發(fā)行版)。

  • 確保 Java 1.7 和 Maven 3.2.x 是已經(jīng)安裝并且配置到環(huán)境變量中。

從源代碼構(gòu)建 Zeppelin

第一步:下載 Zeppelin 源代碼

去這github分支下載源代碼,將這個鏈接復(fù)制并粘貼到你的瀏覽器:https://github.com/elbamos/incubator-zeppelin/tree/rinterpreter

Apache Zeppelin Notebook和R的示例分析

在我的例子中我已經(jīng)下載并解壓文件夾在我的桌面

Apache Zeppelin Notebook和R的示例分析

第二步:構(gòu)建 Zeppelin

假設(shè)你是安裝在單機,打開你的Terminal,運行下面的代碼。如果你是安裝在一個集群,會稍微復(fù)雜一點,具體步驟 Zeppelin 的文檔中找到。

$ cd Desktop/Apache/incubator-zeppelin-rinterpreter
$ mvn clean package -DskipTests

Apache Zeppelin Notebook和R的示例分析

這將需要約16分鐘構(gòu)建Zeppelin、Spark,所有引擎包括R,markdown,shell,hive等。(見下圖)。

Apache Zeppelin Notebook和R的示例分析

第三步:啟動 Zeppelin

運行以下命令啟動Zeppelin:

$ ./bin/zeppelin-daemon.sh start

Apache Zeppelin Notebook和R的示例分析打開web瀏覽器,訪問http://localhost:8080。此時,您已經(jīng)準(zhǔn)備好開始在 Zeppelin 用代碼創(chuàng)建交互筆記本。

Apache Zeppelin Notebook和R的示例分析

交互式數(shù)據(jù)科學(xué)

第一步:創(chuàng)建一個筆記本

單擊下拉箭頭旁邊的“筆記本”頁面,點擊“創(chuàng)建新報告”。

Apache Zeppelin Notebook和R的示例分析

給你的筆記本命名或您可以使用指定的缺省名稱。我命名為“Base R in Apache Zeppelin”。

Apache Zeppelin Notebook和R的示例分析

第二步:開始你的分析

如下圖所示,調(diào)用R可以用“%spark.r”或“%spark.knitr”標(biāo)簽。首先讓我們用 markdown 寫一些介紹。

Apache Zeppelin Notebook和R的示例分析

根據(jù)我們可能需要我們的分析,現(xiàn)在讓我們來安裝一些包。

Apache Zeppelin Notebook和R的示例分析

我們將使用“flights”數(shù)據(jù)集顯示2013年離開紐約的航班,現(xiàn)在讓我們讀取數(shù)據(jù)集。

Apache Zeppelin Notebook和R的示例分析

現(xiàn)在,讓我們使用dplyr(用管道符)做一些數(shù)據(jù)操作。

Apache Zeppelin Notebook和R的示例分析

您還可以使用條形圖和餅圖來可視化一些描述性統(tǒng)計數(shù)據(jù)。

Apache Zeppelin Notebook和R的示例分析

現(xiàn)在,讓我們與ggplot2共舞。

Apache Zeppelin Notebook和R的示例分析

現(xiàn)在,讓我們用caret包做一些統(tǒng)計的機器學(xué)習(xí)。

Apache Zeppelin Notebook和R的示例分析

Apache Zeppelin Notebook和R的示例分析

最后,繪制幾個地圖。
Apache Zeppelin Notebook和R的示例分析

關(guān)于“Apache Zeppelin Notebook和R的示例分析”就介紹到這了,更多相關(guān)內(nèi)容可以搜索億速云以前的文章,希望能夠幫助大家答疑解惑,請多多支持億速云網(wǎng)站!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI