溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

dataWrangler的簡介及使用方法

發(fā)布時間:2021-09-01 07:42:41 來源:億速云 閱讀:413 作者:chen 欄目:大數(shù)據(jù)

本篇內(nèi)容介紹了“dataWrangler的簡介及使用方法”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!

1. 工具簡介

dataWrangler是一款由斯坦福大學開發(fā)的在線數(shù)據(jù)清洗、數(shù)據(jù)重組軟件。主要用于去除無效數(shù)據(jù),將數(shù)據(jù)整理成用戶需要格式等。通過使用dataWrangler能節(jié)約用戶花在數(shù)據(jù)整理上的時間,從而使其有更多的精力用于數(shù)據(jù)分析。

2. 主要特點

dataWrangler的操作極為簡便,通過簡單點擊就能完成一系列的數(shù)據(jù)整理。與傳統(tǒng)的數(shù)據(jù)處理軟件相比,其獨特的智能分析和建議功能,極大方便了用戶的數(shù)據(jù)處理操作。dataWrangler還會列出數(shù)據(jù)修改的歷史記錄,用戶可以極為方便地查看過去的修改,并可以撤銷某一條修改操作。

同時,dataWrangler是一款在線工具,這為用戶省去了安裝軟件的繁瑣過程,也使用戶擺脫了操作系統(tǒng)對軟件使用的限制。

3. 工具界面(工作區(qū)、菜單、術語等)

在瀏覽器的地址欄中輸入dataWrangler的地址并進入后,會進入dataWrangler獲取輸入數(shù)據(jù)的界面,如下圖所示。

dataWrangler的簡介及使用方法

進入dataWrangler后的數(shù)據(jù)輸入界面。

將CSV格式的數(shù)據(jù)拷貝并粘貼到數(shù)據(jù)輸入?yún)^(qū)域后點擊dataWrangle按鈕,進入數(shù)據(jù)處理界面,開始數(shù)據(jù)的整理和修復。數(shù)據(jù)處理界面如下圖所示。

dataWrangler的簡介及使用方法

數(shù)據(jù)處理主界面。

數(shù)據(jù)處理界面左側(cè)的面板包括一個根據(jù)當前選中數(shù)據(jù)給出的數(shù)據(jù)修改建議列表和一個數(shù)據(jù)操作歷史記錄列表。點擊修改建議列表中的粗體部分,就可以執(zhí)行該條修改建議。界面的右側(cè)是包含具體數(shù)據(jù)的數(shù)據(jù)表。

4. 操作流程(核心功能呈現(xiàn))

下面介紹dataWrangler的主要功能。

->去除無效數(shù)據(jù)

點擊無效數(shù)據(jù)的行號,這一行就會變成紅色高亮狀態(tài),同時左側(cè)的建議欄會給出一系列的修改建議。點擊合適的修改建議后, 該修改操作將被執(zhí)行。

dataWrangler的簡介及使用方法

刪除空行操作。

如圖所示,點擊”Delete empty rows”的修改建議后,所有空白行將被刪除。

->提取部分數(shù)據(jù)

在需要提取部分數(shù)據(jù)作為單獨一列時,首先選中欲提取的數(shù)據(jù),此時dataWrangler會自動分析用戶的意圖,并提取出相應數(shù)據(jù)。如果用戶進行二次選取,則會對選取意圖進行修正,以提取用戶真正需要的數(shù)據(jù)。

下圖是用戶欲提取州名時,首先選取了”Alabama”,但此時dataWrangler認為用戶想要提取相應長度的字符,  所以沒有達到要求的”Alaska”并未被選取, 同時”California”等較長的字符也只被截取了一部分。

dataWrangler的簡介及使用方法

選擇欲提取的數(shù)據(jù)。

此時,繼續(xù)選取”Alaska”,dataWrangler通過二次選取獲知用戶想要提取的是這一位置的整個單詞,進而成功提取出了州名。如下圖所示。

dataWrangler的簡介及使用方法

通過二次選取修正提取結(jié)果。

->自動填充數(shù)據(jù)

提取出州名后,需要將其填充到每一行數(shù)據(jù)中。此時,只需點擊一下州名數(shù)據(jù)列最上方的標題,左側(cè)的智能建議欄中就會出現(xiàn)自動填充數(shù)據(jù)的建議。點擊該建議,即可完成自動填充數(shù)據(jù),如下圖所示。

dataWrangler的簡介及使用方法

自動填充數(shù)據(jù)。

->刪除無用數(shù)據(jù)

進行數(shù)據(jù)自動填充后,遺留下來的一些數(shù)據(jù)欄已經(jīng)沒有任何意義,需將其刪除。點擊欲刪除數(shù)據(jù)中國的某一行,dataWrangler會自動給出刪除建議。同時,將被刪除的行將會高亮表示,如下圖所示。

dataWrangler的簡介及使用方法

刪除無用行。

點擊左側(cè)刪除建議執(zhí)行刪除操作,結(jié)果如下圖所示。

dataWrangler的簡介及使用方法

刪除無用行后的結(jié)果。

->數(shù)據(jù)重構

在某些情況下,可能需要將數(shù)據(jù)重新組合成需要的格式。點擊表格上方的綠色方塊后,dataWrangler會給出多種數(shù)據(jù)重構建議。如下圖所示。

dataWrangler的簡介及使用方法

對數(shù)據(jù)進行重構。

雙擊列名,可以對列名進行編輯, 圖中的列名已經(jīng)修改為”year”,”state”等有意義的文字。

點擊左側(cè)重構建議后,得到的數(shù)據(jù)結(jié)果如下圖所示。

dataWrangler的簡介及使用方法

數(shù)據(jù)重構后的結(jié)果。

此時,每一行是一個州在不同年份的數(shù)據(jù)。

“dataWrangler的簡介及使用方法”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識可以關注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI