您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“dataWrangler的簡介及使用方法”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!
1. 工具簡介
dataWrangler是一款由斯坦福大學開發(fā)的在線數(shù)據(jù)清洗、數(shù)據(jù)重組軟件。主要用于去除無效數(shù)據(jù),將數(shù)據(jù)整理成用戶需要格式等。通過使用dataWrangler能節(jié)約用戶花在數(shù)據(jù)整理上的時間,從而使其有更多的精力用于數(shù)據(jù)分析。
2. 主要特點
dataWrangler的操作極為簡便,通過簡單點擊就能完成一系列的數(shù)據(jù)整理。與傳統(tǒng)的數(shù)據(jù)處理軟件相比,其獨特的智能分析和建議功能,極大方便了用戶的數(shù)據(jù)處理操作。dataWrangler還會列出數(shù)據(jù)修改的歷史記錄,用戶可以極為方便地查看過去的修改,并可以撤銷某一條修改操作。
同時,dataWrangler是一款在線工具,這為用戶省去了安裝軟件的繁瑣過程,也使用戶擺脫了操作系統(tǒng)對軟件使用的限制。
3. 工具界面(工作區(qū)、菜單、術語等)
在瀏覽器的地址欄中輸入dataWrangler的地址并進入后,會進入dataWrangler獲取輸入數(shù)據(jù)的界面,如下圖所示。
進入dataWrangler后的數(shù)據(jù)輸入界面。
將CSV格式的數(shù)據(jù)拷貝并粘貼到數(shù)據(jù)輸入?yún)^(qū)域后點擊dataWrangle按鈕,進入數(shù)據(jù)處理界面,開始數(shù)據(jù)的整理和修復。數(shù)據(jù)處理界面如下圖所示。
數(shù)據(jù)處理主界面。
數(shù)據(jù)處理界面左側(cè)的面板包括一個根據(jù)當前選中數(shù)據(jù)給出的數(shù)據(jù)修改建議列表和一個數(shù)據(jù)操作歷史記錄列表。點擊修改建議列表中的粗體部分,就可以執(zhí)行該條修改建議。界面的右側(cè)是包含具體數(shù)據(jù)的數(shù)據(jù)表。
4. 操作流程(核心功能呈現(xiàn))
下面介紹dataWrangler的主要功能。
->去除無效數(shù)據(jù)
點擊無效數(shù)據(jù)的行號,這一行就會變成紅色高亮狀態(tài),同時左側(cè)的建議欄會給出一系列的修改建議。點擊合適的修改建議后, 該修改操作將被執(zhí)行。
刪除空行操作。
如圖所示,點擊”Delete empty rows”的修改建議后,所有空白行將被刪除。
->提取部分數(shù)據(jù)
在需要提取部分數(shù)據(jù)作為單獨一列時,首先選中欲提取的數(shù)據(jù),此時dataWrangler會自動分析用戶的意圖,并提取出相應數(shù)據(jù)。如果用戶進行二次選取,則會對選取意圖進行修正,以提取用戶真正需要的數(shù)據(jù)。
下圖是用戶欲提取州名時,首先選取了”Alabama”,但此時dataWrangler認為用戶想要提取相應長度的字符, 所以沒有達到要求的”Alaska”并未被選取, 同時”California”等較長的字符也只被截取了一部分。
選擇欲提取的數(shù)據(jù)。
此時,繼續(xù)選取”Alaska”,dataWrangler通過二次選取獲知用戶想要提取的是這一位置的整個單詞,進而成功提取出了州名。如下圖所示。
通過二次選取修正提取結(jié)果。
->自動填充數(shù)據(jù)
提取出州名后,需要將其填充到每一行數(shù)據(jù)中。此時,只需點擊一下州名數(shù)據(jù)列最上方的標題,左側(cè)的智能建議欄中就會出現(xiàn)自動填充數(shù)據(jù)的建議。點擊該建議,即可完成自動填充數(shù)據(jù),如下圖所示。
自動填充數(shù)據(jù)。
->刪除無用數(shù)據(jù)
進行數(shù)據(jù)自動填充后,遺留下來的一些數(shù)據(jù)欄已經(jīng)沒有任何意義,需將其刪除。點擊欲刪除數(shù)據(jù)中國的某一行,dataWrangler會自動給出刪除建議。同時,將被刪除的行將會高亮表示,如下圖所示。
刪除無用行。
點擊左側(cè)刪除建議執(zhí)行刪除操作,結(jié)果如下圖所示。
刪除無用行后的結(jié)果。
->數(shù)據(jù)重構
在某些情況下,可能需要將數(shù)據(jù)重新組合成需要的格式。點擊表格上方的綠色方塊后,dataWrangler會給出多種數(shù)據(jù)重構建議。如下圖所示。
對數(shù)據(jù)進行重構。
雙擊列名,可以對列名進行編輯, 圖中的列名已經(jīng)修改為”year”,”state”等有意義的文字。
點擊左側(cè)重構建議后,得到的數(shù)據(jù)結(jié)果如下圖所示。
數(shù)據(jù)重構后的結(jié)果。
此時,每一行是一個州在不同年份的數(shù)據(jù)。
“dataWrangler的簡介及使用方法”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識可以關注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。