您好,登錄后才能下訂單哦!
前幾天和一朋友A聊天,一個(gè)在我看來(lái)完全可以在大部分行業(yè)領(lǐng)域公司獨(dú)當(dāng)一面的數(shù)據(jù)分析師,目前仍謙虛的以“數(shù)據(jù)猿”自稱。從事數(shù)據(jù)分析的他,半路出家,起初雖然懂一些數(shù)據(jù)庫(kù)的知識(shí),但仍然和很多人一樣,艱難地上了路。于是我們就索性一起討討經(jīng),“一本正經(jīng)”地聊起工作來(lái),留下點(diǎn)感悟。
說(shuō)入門很簡(jiǎn)單一定是騙你的,A說(shuō)自己是從記數(shù)據(jù)開(kāi)始的,記數(shù)據(jù)一方面是為了應(yīng)付領(lǐng)導(dǎo)的提問(wèn),另一方面也是在培養(yǎng)數(shù)據(jù)的敏感度。確實(shí),分析的源頭一般是某些指標(biāo)有了明顯的變動(dòng),熟悉每天的交易數(shù)據(jù)或用戶數(shù)據(jù)能讓你一眼就看出問(wèn)題在哪里,哪些數(shù)據(jù)有關(guān)聯(lián),然后再做分析。而我是從Excel做起的,大部分時(shí)間都是在取數(shù),做“表哥”,還要抵擋來(lái)自業(yè)務(wù)的需求***。后來(lái),他去做了數(shù)據(jù)挖掘,我從BI再?gòu)臄?shù)據(jù)平臺(tái)轉(zhuǎn)做了技術(shù)。
萬(wàn)事開(kāi)頭難,但一旦數(shù)據(jù)分析有了動(dòng)力,就要開(kāi)始完善自己的知識(shí)體系,這也是真正入門的開(kāi)端。那如何完善數(shù)據(jù)分析的知識(shí)體系?
1、基本的計(jì)算機(jī)知識(shí)和統(tǒng)計(jì)知識(shí)
數(shù)據(jù)庫(kù)+SQL語(yǔ)言
一些常用的數(shù)據(jù)庫(kù)如Oracle、SQL Sever、DB2、MySQL,這些數(shù)據(jù)庫(kù)或者說(shuō)日常接觸的數(shù)據(jù)庫(kù)都要有所了解,懂最常用的就好,最重要的還是要會(huì)寫(xiě)SQL。
數(shù)學(xué)/統(tǒng)計(jì)學(xué)知識(shí)
一些基本的數(shù)學(xué)統(tǒng)計(jì)方法如描述性統(tǒng)計(jì)、多元統(tǒng)計(jì)分析、回歸分析等,重要性不言而喻。
數(shù)據(jù)挖掘知識(shí):方差分析、回歸分析、因子分析、聚類分析等等。這些東西作為入門多多少少都要會(huì)一些,雖然有可能不會(huì)全用到,但一旦用時(shí)方恨少。
數(shù)據(jù)分析可視工具
數(shù)據(jù)分析可視化工具很寬泛。首推Excel,中小公司很依賴,熟練使用數(shù)據(jù)透視表,這是必備技能。中大型公司都是用報(bào)表工具或者BI來(lái)做報(bào)表,但有了SQL+Excel的基礎(chǔ),這些工具上手都很快。
2、業(yè)務(wù)知識(shí)
數(shù)據(jù)分析師要與公司的各業(yè)務(wù)打交道,所以對(duì)于各部門的業(yè)務(wù)知識(shí)要有深入的了解。某業(yè)務(wù)領(lǐng)導(dǎo)需要知道某個(gè)指標(biāo),你需要知道這個(gè)指標(biāo)由哪些數(shù)據(jù)構(gòu)成?數(shù)據(jù)統(tǒng)計(jì)的口徑是什么?數(shù)據(jù)怎么取出來(lái)?這個(gè)指標(biāo)對(duì)于行業(yè)的意義是什么,處于什么范圍分別對(duì)應(yīng)什么樣的情況,是好還是壞。然后慢慢摸索這個(gè)指標(biāo)層面多維度的規(guī)律,如何設(shè)定最合理。
附上網(wǎng)上的一張數(shù)據(jù)分析師能力體系圖,用于參考。
數(shù)據(jù)分析是一向比較專業(yè)的工作,要時(shí)刻警惕自己能力是否有提升,目前是什么樣的水平,習(xí)慣反思自己:
這里引用知乎上@任明遠(yuǎn)的回答
1、你了解你所整理的數(shù)據(jù)的來(lái)源嗎?是自己公司的業(yè)務(wù)數(shù)據(jù),還是與合作伙伴交換的數(shù)據(jù)?是自己公司相關(guān)部門采集的,還是從第三方獲取的?獲取過(guò)程中,具體的指標(biāo)和邏輯是什么?
2、這些數(shù)據(jù)是真實(shí)的嗎?采集和整理過(guò)程中會(huì)不會(huì)出現(xiàn)什么問(wèn)題?技術(shù)上的邏輯和業(yè)務(wù)上的邏輯是不同的概念,有沒(méi)有技術(shù)上沒(méi)有瑕疵,但并不符合業(yè)務(wù)邏輯的數(shù)據(jù)流程?
3、到你手里的數(shù)據(jù)經(jīng)過(guò)了什么處理?你又做了什么處理?為什么他們和你要做這些處理?
4、誰(shuí)需要你的數(shù)據(jù)?你處理后的數(shù)據(jù)流向哪里?他們用數(shù)據(jù)做什么?這些數(shù)據(jù)最終又拿去做了什么?比如,為客戶做了什么服務(wù),公司發(fā)布了什么內(nèi)容,或向管理層證明了什么KPI,或支持了哪個(gè)部門的評(píng)估?
5、你做整理的周期是什么?為什么是這樣的周期?
6、公司有其他的部門在處理其他的數(shù)據(jù)嗎?是什么樣的數(shù)據(jù)?和你有什么關(guān)系?為什么這些數(shù)據(jù)要分開(kāi)處理?
7、近一年,你自己的電腦上應(yīng)該已經(jīng)積累了不少數(shù)據(jù),試試做個(gè)分析,從一段較長(zhǎng)的時(shí)間來(lái)看,你負(fù)責(zé)的這一塊數(shù)據(jù)發(fā)生了什么變化?為什么會(huì)有這個(gè)變化?和公司的產(chǎn)品、經(jīng)營(yíng)、業(yè)務(wù)有關(guān),還是和行業(yè)有關(guān)?具體怎么有關(guān)?
業(yè)務(wù)上
1.業(yè)務(wù)為核心,數(shù)據(jù)為王
了解整個(gè)產(chǎn)業(yè)鏈的結(jié)構(gòu)
制定好業(yè)務(wù)的發(fā)展規(guī)劃
了解衡量的核心指標(biāo)
有了數(shù)據(jù)必須和業(yè)務(wù)結(jié)合才有效果
需要懂業(yè)務(wù)的整體概況,摸清楚所在產(chǎn)業(yè)鏈的整個(gè)結(jié)構(gòu),對(duì)行業(yè)的上游和下游的經(jīng)營(yíng)情況有大致的了解。然后根據(jù)業(yè)務(wù)當(dāng)前的需要,指定發(fā)展計(jì)劃,從而歸類出需要整理的數(shù)據(jù)。最后一步詳細(xì)的列出數(shù)據(jù)核心指標(biāo)(KPI),并且對(duì)幾個(gè)核心指標(biāo)進(jìn)行更細(xì)致的拆解,當(dāng)然具體結(jié)合你的業(yè)務(wù)屬性來(lái)處理,找出那些對(duì)指標(biāo)影響幅度較大的影響因子。前期資料的收集以及業(yè)務(wù)現(xiàn)況的全面掌握非常關(guān)鍵。
2.思考指標(biāo)現(xiàn)狀,發(fā)現(xiàn)多維規(guī)律
熟悉產(chǎn)品框架,全面定義每個(gè)指標(biāo)的運(yùn)營(yíng)現(xiàn)狀對(duì)
比同行業(yè)指標(biāo),挖掘隱藏的提升空間
拆解關(guān)鍵指標(biāo),合理設(shè)置運(yùn)營(yíng)方法來(lái)觀察效果
爭(zhēng)對(duì)核心用戶,單獨(dú)進(jìn)行產(chǎn)品用研與需求挖掘
業(yè)務(wù)的分析大多是定性的,需要培養(yǎng)一種客觀的感覺(jué)意識(shí)。定性的分析則需要借助技術(shù)、工具、機(jī)器。而感覺(jué)的培養(yǎng),由于每個(gè)人的思維、感知都不同,只能把控大體的方向,很多數(shù)據(jù)元素之間的關(guān)系還是需要通過(guò)數(shù)據(jù)可視化技術(shù)來(lái)實(shí)現(xiàn)。
3.規(guī)律驗(yàn)證,經(jīng)驗(yàn)總結(jié)
發(fā)現(xiàn)了規(guī)律之后不能立刻上線,需要在測(cè)試機(jī)上對(duì)模型進(jìn)行驗(yàn)證。
技能上
1.Excel是否精鉆?
除了常用的Excel函數(shù)(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel圖表(餅圖、線圖、柱形圖、雷達(dá)圖等)和簡(jiǎn)單分析技能也是經(jīng)常用的,可以幫助你快速分析業(yè)務(wù)走勢(shì)和異常情況;另外,Excel里面的函數(shù)結(jié)合透視表以及VBA功能是完善報(bào)表開(kāi)發(fā)的利器,讓你一鍵輕松搞定報(bào)表。
2.你需要更懂?dāng)?shù)據(jù)庫(kù)
常用的數(shù)據(jù)庫(kù)如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL語(yǔ)句的熟練使用,對(duì)于數(shù)據(jù)庫(kù)的存儲(chǔ)讀取過(guò)程也要熟練掌握。在對(duì)于大數(shù)據(jù)量處理時(shí),如何想辦法加快程序的運(yùn)行速度、減少網(wǎng)絡(luò)流量、提高數(shù)據(jù)庫(kù)的安全性是非常有必要的。
3.掌握數(shù)據(jù)整理、可視化和報(bào)表制作
數(shù)據(jù)整理,是將原始數(shù)據(jù)轉(zhuǎn)換成方便實(shí)用的格式,Excel在協(xié)同工作上并不是一個(gè)好工具,報(bào)表FineReport比較推薦。項(xiàng)目部署的Tableau、FineBI、Qlikview一類BI工具,有沒(méi)有好好培訓(xùn)學(xué)習(xí),這些便捷的工具都能淡化數(shù)據(jù)分析時(shí)一些重復(fù)性操作,把精力更多留于分析。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。