溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

基于無(wú)埋點(diǎn)技術(shù)的用戶(hù)行為分析

發(fā)布時(shí)間:2020-06-27 07:53:20 來(lái)源:網(wǎng)絡(luò) 閱讀:1054 作者:HarmonyCloud 欄目:大數(shù)據(jù)

用戶(hù)行為分析從狹義來(lái)看是用戶(hù)的行為數(shù)據(jù)分析,但是廣義來(lái)說(shuō)這一個(gè)詞包含用戶(hù)分析,用戶(hù)行為的結(jié)果分析,用戶(hù)的行為分析。用戶(hù)行為的結(jié)果和用戶(hù)的行為分析是不一樣的,一個(gè)是結(jié)果,一個(gè)是過(guò)程?,F(xiàn)在國(guó)內(nèi)市場(chǎng)上關(guān)于用戶(hù)行為分析的產(chǎn)品分為基于前臺(tái)數(shù)據(jù)的用戶(hù)行為分析和基于后臺(tái)數(shù)據(jù)的用戶(hù)行為分析?;谇芭_(tái)技術(shù)的用戶(hù)行為分析側(cè)重于用戶(hù)的行為分析,而基于后臺(tái)技術(shù)的用戶(hù)行為分析側(cè)重于用戶(hù)行為的結(jié)果分析。這兩類(lèi)產(chǎn)品可以說(shuō)是有一定的片面性,完成的只是用戶(hù)行為分析的一部分。基于這個(gè)現(xiàn)狀來(lái)談?wù)勅娴挠脩?hù)行為分析應(yīng)該怎么做。這篇文章主要會(huì)從數(shù)據(jù)來(lái)源和數(shù)據(jù)收集方式兩個(gè)角度來(lái)說(shuō)。

 

 戶(hù)數(shù)據(jù)來(lái)源

數(shù)據(jù)是用戶(hù)行為分析的大前提,一切的分析都始于數(shù)據(jù),巧婦難為無(wú)米之炊。用戶(hù)行為的數(shù)據(jù)來(lái)源有前臺(tái)點(diǎn)擊數(shù)據(jù)和后臺(tái)業(yè)務(wù)數(shù)據(jù)。僅僅使用后臺(tái)的業(yè)務(wù)數(shù)據(jù),會(huì)導(dǎo)致前臺(tái)用戶(hù)行為缺失,這樣和僅僅通過(guò)數(shù)據(jù)庫(kù)做傳統(tǒng)地統(tǒng)計(jì)實(shí)現(xiàn)的效果差不多。假設(shè)有兩種路徑能夠下單(用字母D表示),A-B-C-E-D 和A-B-F-D。那么僅僅通過(guò)后臺(tái)數(shù)據(jù)我們知道一個(gè)客戶(hù)下單了,下單金額是多少,那么如果我們想知道哪種路徑引導(dǎo)才能讓客戶(hù)更容易下單呢?

僅僅使用前臺(tái)數(shù)據(jù),還是上面那個(gè)例子,雖然能夠識(shí)別出用戶(hù)是來(lái)自A-B-F-D下單的,但是要想分析這個(gè)路徑帶來(lái)的用戶(hù)有多大價(jià)值,在之后這個(gè)用戶(hù)有沒(méi)有回來(lái),他之后有在我們產(chǎn)品消費(fèi)了多少,像這種復(fù)雜的分析,依賴(lài)前臺(tái)數(shù)據(jù)也是做不到的。

如果想分析用戶(hù)結(jié)果是依靠什么行為產(chǎn)生的,以此來(lái)優(yōu)化產(chǎn)品和業(yè)務(wù)來(lái)反向獲得更好的結(jié)果,相反的想要根據(jù)用戶(hù)行為來(lái)衡量行為模式的效果, 就需要將前后臺(tái)數(shù)據(jù)打通進(jìn)行關(guān)聯(lián)分析。舉個(gè)例子,訂單金額大于1萬(wàn)的高凈值客戶(hù)行為以及其轉(zhuǎn)化率這個(gè)指標(biāo)就必須通過(guò)前臺(tái)數(shù)據(jù)和后臺(tái)數(shù)據(jù)相結(jié)合的方式。

怎么把來(lái)自前臺(tái)和后臺(tái)的用戶(hù)數(shù)據(jù)關(guān)聯(lián)起來(lái)?這是需要解決的問(wèn)題。

 戶(hù)數(shù)據(jù)收集技術(shù)

用戶(hù)行為數(shù)據(jù)收集技術(shù)主要有兩種:埋點(diǎn)和無(wú)埋點(diǎn)。先來(lái)科普先這兩種技術(shù)方式,以及說(shuō)明下應(yīng)該怎么選擇。

埋點(diǎn)

所謂埋點(diǎn)就是為了數(shù)據(jù)分析的需求在原本的復(fù)雜的代碼邏輯之上在加上N行獲取數(shù)據(jù)的代碼。比如如果想獲取某商品的點(diǎn)擊數(shù)量,就得在點(diǎn)擊事件的中搜集點(diǎn)擊的商品數(shù)據(jù),發(fā)出包含商品名稱(chēng)和點(diǎn)擊事件的數(shù)據(jù)({productname,clicktime})。

埋點(diǎn)的優(yōu)勢(shì):

1)埋點(diǎn)最大的優(yōu)勢(shì)就是數(shù)據(jù)都是手動(dòng)編碼產(chǎn)生的,靈活性比較大,可以更好得支持一些擴(kuò)展數(shù)據(jù)。

2)埋點(diǎn)由于是按照埋點(diǎn)邏輯進(jìn)行的預(yù)處理,所以對(duì)之后的分析友好,分析效果也比較好。

埋點(diǎn)的劣勢(shì):

1)埋點(diǎn)最重要的前提條件是必須十分清楚目標(biāo),即需要收集什么樣的數(shù)據(jù)必須提前確定。所以埋點(diǎn)最容易出現(xiàn)的問(wèn)題就是漏埋,一般來(lái)說(shuō)在發(fā)布前一定要經(jīng)過(guò)謹(jǐn)慎的校驗(yàn)和測(cè)試,因?yàn)橐坏┌姹景l(fā)布出去而數(shù)據(jù)采集出了問(wèn)題。

2)在產(chǎn)品的迭代過(guò)程中,如果代碼再迭代的時(shí)候忽略了埋點(diǎn)邏輯的更改,從而導(dǎo)致后續(xù)的分析邏輯不準(zhǔn),甚至導(dǎo)致產(chǎn)品bug。更甚于對(duì)于產(chǎn)品迭代比較快的場(chǎng)景,埋點(diǎn)就是一個(gè)×××。

無(wú)埋點(diǎn)

埋點(diǎn)技術(shù)和無(wú)埋點(diǎn)技術(shù)都需要在原有的業(yè)務(wù)代碼上進(jìn)行改動(dòng)。無(wú)埋點(diǎn)就是通過(guò)編程語(yǔ)言自身的特點(diǎn)來(lái)完成數(shù)據(jù)收集的自動(dòng)化過(guò)程。比如前臺(tái)無(wú)埋點(diǎn)其實(shí)就是通過(guò)監(jiān)聽(tīng)JS事件,把頁(yè)面上發(fā)生的所有事件都采集下來(lái)。后臺(tái)無(wú)埋點(diǎn)實(shí)現(xiàn)比較復(fù)雜,但是說(shuō)起來(lái)很簡(jiǎn)單,其實(shí)就是將網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行旁路反解析,前后端交互的數(shù)據(jù)肯定都會(huì)經(jīng)過(guò)網(wǎng)絡(luò),所以網(wǎng)絡(luò)中應(yīng)該包含了絕大多數(shù)業(yè)務(wù)數(shù)據(jù)。 

無(wú)埋點(diǎn)的優(yōu)勢(shì):

1) 相對(duì)于埋點(diǎn)方式帶來(lái)的收益就是正好就是埋點(diǎn)容易產(chǎn)生的問(wèn)題,由于采集的是全量數(shù)據(jù),所以產(chǎn)品迭代過(guò)程中是不需要關(guān)注埋點(diǎn)邏輯的,也不會(huì)出現(xiàn)漏埋、誤埋等現(xiàn)象。

2)無(wú)埋點(diǎn)方式因?yàn)槭占氖侨繑?shù)據(jù),可以大大減少運(yùn)營(yíng)和產(chǎn)品的試錯(cuò)成本,試錯(cuò)的可能性高了,可以帶來(lái)更多啟發(fā)性的信息。

3)最后一點(diǎn),也是最清楚的一點(diǎn),就是減少了因?yàn)槿藛T流動(dòng)帶來(lái)的溝通成本。

無(wú)埋點(diǎn)的缺陷,也是無(wú)埋點(diǎn)存在的一些質(zhì)疑點(diǎn):

1)適用大部門(mén),通用的場(chǎng)景,有少部分需要埋點(diǎn)的場(chǎng)景覆蓋不了。

2)無(wú)埋點(diǎn)采集全量數(shù)據(jù),給數(shù)據(jù)傳輸和服務(wù)器增加壓力

根據(jù)前面關(guān)于埋點(diǎn)和無(wú)埋點(diǎn)的科普,我們都明白其實(shí)兩個(gè)方式都有其自身的優(yōu)勢(shì)和缺陷,知乎等其他技術(shù)博客上關(guān)于這兩個(gè)討論點(diǎn)的文章也有很多,有人在批埋點(diǎn),有人在批無(wú)埋點(diǎn)。關(guān)于技術(shù),我們還是理性看待吧,它們兩個(gè)不是你死我活的關(guān)系,通過(guò)我們調(diào)研的得到的情況是,目前沒(méi)有方案能夠完美解決無(wú)埋點(diǎn)問(wèn)題,但是我們致力于研究最大限度通過(guò)通用方式解決埋點(diǎn)問(wèn)題,盡量減少埋點(diǎn)代碼,埋點(diǎn)代碼越少,出錯(cuò)的可能性就越低。我們選擇使用前臺(tái)無(wú)埋點(diǎn)和后臺(tái)無(wú)埋點(diǎn)技術(shù)相結(jié)合的方式來(lái)獲取用戶(hù)數(shù)據(jù)。

 

 如何利用無(wú)埋點(diǎn)打通前后臺(tái)數(shù)據(jù)

當(dāng)前的分析手段,都需要進(jìn)行大量埋點(diǎn)以及關(guān)聯(lián)才能做到前臺(tái)和后臺(tái)數(shù)據(jù)打通,有沒(méi)有可能通過(guò)無(wú)埋點(diǎn)將前后臺(tái)數(shù)據(jù)自動(dòng)關(guān)聯(lián)打通?

前臺(tái)無(wú)埋點(diǎn)弊端

前端無(wú)埋點(diǎn)針對(duì)數(shù)據(jù)分析比較簡(jiǎn)單需求是很合適的,如果是僅僅分析頁(yè)面跳轉(zhuǎn),轉(zhuǎn)化率、或者控件點(diǎn)擊等行為,前端無(wú)埋點(diǎn)完全能夠勝任。但是如果要做細(xì)粒度的分析,僅僅靠前端無(wú)埋點(diǎn)可能存在困難,最關(guān)鍵的原因就是前臺(tái)采集技術(shù)再先進(jìn)也還是有些數(shù)據(jù)難以采集到,比如客戶(hù)的下單金額等數(shù)據(jù),這些數(shù)據(jù)很多都是以html形式傳到前臺(tái),在不同的技術(shù)實(shí)現(xiàn)中,前臺(tái)所展示的金額數(shù)據(jù)可能僅僅是展示數(shù)據(jù),并不會(huì)再傳至后臺(tái)。所以導(dǎo)致如果想要做一些按照客單價(jià)分群的行為,就很難僅僅依靠前端無(wú)埋點(diǎn)技術(shù)來(lái)實(shí)現(xiàn)。

后臺(tái)無(wú)埋點(diǎn)的引入

在典型的前后臺(tái)交互的程序中,數(shù)據(jù)最通用的來(lái)源,我們發(fā)現(xiàn)是wired data。Wired data應(yīng)該包含了90%以上的細(xì)粒度的業(yè)務(wù)數(shù)據(jù),只是這些數(shù)據(jù)是以不同格式存在于wired data中,這里面的難度就是設(shè)計(jì)一種數(shù)據(jù)處理方案,能夠通用的將存在于wired data的數(shù)據(jù)利用起來(lái),這是后臺(tái)無(wú)埋點(diǎn)的實(shí)現(xiàn)關(guān)鍵。

前后臺(tái)數(shù)據(jù)自動(dòng)打通

前后臺(tái)無(wú)埋點(diǎn)的關(guān)聯(lián)點(diǎn)就在于cookie,在用戶(hù)請(qǐng)求中埋入特殊的sessioniduid。后臺(tái)的數(shù)據(jù)采集wired data中如用戶(hù)信息,通過(guò)sessioniduid關(guān)聯(lián)之后,就可以知道某次下單業(yè)務(wù)是哪個(gè)用戶(hù)操作的,在頁(yè)面上有何種行為。我們采用這種方式實(shí)現(xiàn)了前后數(shù)據(jù)的自動(dòng)關(guān)聯(lián)。


向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI