溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

個(gè)數(shù)是如何用大數(shù)據(jù)做行為預(yù)測(cè)的?

發(fā)布時(shí)間:2020-07-29 13:27:18 來(lái)源:網(wǎng)絡(luò) 閱讀:331 作者:個(gè)推 欄目:大數(shù)據(jù)

“個(gè)數(shù)”是“個(gè)推”旗下面向 APP 開(kāi)發(fā)者提供數(shù)據(jù)統(tǒng)計(jì)分析的產(chǎn)品?!皞€(gè)數(shù)”通過(guò)可視化埋點(diǎn)技術(shù)及大數(shù)據(jù)分析能力從用戶屬性、渠道質(zhì)量、行業(yè)對(duì)比等維度對(duì) APP 進(jìn)行全面的統(tǒng)計(jì)分析。

“個(gè)數(shù)”不僅可以及時(shí)統(tǒng)計(jì)用戶的活躍、新增等,還可以分析卸載用戶的成分、流向,此外還能實(shí)現(xiàn)流失、付費(fèi)等用戶關(guān)鍵行為的預(yù)測(cè),從而幫助 APP 開(kāi)發(fā)者實(shí)現(xiàn)用戶精細(xì)化運(yùn)營(yíng)和全生命周期管理。其中很值得一提的是,“個(gè)數(shù)”在“可視化埋點(diǎn)”及“行為預(yù)測(cè)”方面的創(chuàng)新,為 APP 開(kāi)發(fā)者在實(shí)際運(yùn)營(yíng)中帶來(lái)了極大便利,所以,在下文中,我們也將圍繞這兩點(diǎn)做詳細(xì)的分析。


可視化埋點(diǎn)

埋點(diǎn)是指在產(chǎn)品流程的關(guān)鍵部位植入相關(guān)統(tǒng)計(jì)代碼,以追蹤用戶行為,統(tǒng)計(jì)關(guān)鍵流程的使用程度,并將數(shù)據(jù)以日志的方式上報(bào)至服務(wù)器的過(guò)程。

目前,數(shù)據(jù)埋點(diǎn)采集模式主要有代碼埋點(diǎn)、無(wú)埋點(diǎn)、可視化埋點(diǎn)等方式。

“代碼埋點(diǎn)”是指在監(jiān)控頁(yè)面上加入基礎(chǔ) js,根據(jù)需求添加監(jiān)控代碼,它的優(yōu)點(diǎn)是靈活,可以自定義設(shè)置,可以選擇自己需要的數(shù)據(jù)來(lái)分析,但對(duì)復(fù)雜網(wǎng)站來(lái)說(shuō),每次修改一個(gè)頁(yè)面就得重新出一份埋點(diǎn)方案,成本較大。目前,采用這種埋點(diǎn)方案的代表產(chǎn)品有百度統(tǒng)計(jì)、友盟、騰訊云分析、Google Analytics 等。

“可視化埋點(diǎn)”通常是指開(kāi)發(fā)者通過(guò)設(shè)備連接用戶行為分析工具,直接在數(shù)據(jù)接入管理界面上對(duì)可交互且交互后有效果的頁(yè)面元素(如:圖片、按鈕、鏈接等)進(jìn)行操作實(shí)現(xiàn)數(shù)據(jù)埋點(diǎn),下發(fā)采集代碼生效回?cái)?shù)的埋點(diǎn)方式。目前,可視化埋點(diǎn)的代表產(chǎn)品有個(gè)數(shù)、Mixpanel、神策數(shù)據(jù)等。

“無(wú)埋點(diǎn)”與“全埋點(diǎn)”相似,它的原理是“全部采集,按需選取”,也就是說(shuō)它可以對(duì)頁(yè)面中所有交互元素的用戶行為進(jìn)行采集,它是先盡可能多收集檢測(cè)頁(yè)面的內(nèi)容,然后再通過(guò)界面配置決定分析哪些數(shù)據(jù),但它是標(biāo)準(zhǔn)化采集,如果需要設(shè)置自定義的采集方式仍需要代碼埋點(diǎn)助力。這種方案的代表產(chǎn)品有 GrowingIO、數(shù)極客、百度統(tǒng)計(jì)等。

“個(gè)數(shù)”為什么會(huì)選用可視化埋點(diǎn)?

當(dāng)下移動(dòng)互聯(lián)網(wǎng)正處于高速發(fā)展且發(fā)展形勢(shì)瞬息萬(wàn)變的階段中,開(kāi)發(fā)者需要及時(shí)根據(jù)大數(shù)據(jù)的分析、反饋,對(duì)業(yè)務(wù)功能等做出調(diào)整,在傳統(tǒng)的操作模式中,如果想要了解不同節(jié)點(diǎn)的數(shù)據(jù),就要修改相應(yīng)代碼里面的埋點(diǎn),然后測(cè)試發(fā)布,之后再在應(yīng)用商店審核、上線,整個(gè)周期可能長(zhǎng)達(dá)幾個(gè)星期,這顯然無(wú)法滿足業(yè)務(wù)的需求。所以,“個(gè)數(shù)”采用的“可視化埋點(diǎn)”技術(shù)就是為了幫助開(kāi)發(fā)者解決這個(gè)問(wèn)題的。

“個(gè)數(shù)”的可視化埋點(diǎn)靈活、方便,不需對(duì)數(shù)據(jù)追蹤點(diǎn)添加任何代碼,使用者只需要通過(guò)設(shè)備連接管理臺(tái),對(duì)頁(yè)面可埋點(diǎn)的元素圈圈點(diǎn)點(diǎn),即可添加隨時(shí)生效的界面追蹤點(diǎn),同時(shí)在數(shù)據(jù)采集模式及數(shù)據(jù)分析能力上,“個(gè)數(shù)”能夠提供給開(kāi)發(fā)者們準(zhǔn)確的、有效的數(shù)據(jù)。

個(gè)數(shù)是如何用大數(shù)據(jù)做行為預(yù)測(cè)的?
可視化埋點(diǎn)主要具有以下特性:

1、零代碼,無(wú)需代碼,節(jié)省成本
2、免更新,新增便捷,無(wú)需升級(jí)
3、易測(cè)試,圈選測(cè)試,實(shí)時(shí)呈現(xiàn)
換而言之,可視化埋點(diǎn)不僅可以節(jié)約企業(yè)成本,還可以提高開(kāi)發(fā)人員和運(yùn)營(yíng)人員的工作效率。


行為預(yù)測(cè)

“個(gè)數(shù)”的行為預(yù)測(cè)主要包括流失預(yù)測(cè)、卸載預(yù)測(cè)、付費(fèi)預(yù)測(cè)等,它的原理是基于 App 歷史行為數(shù)據(jù)構(gòu)建算法模型預(yù)測(cè)用戶關(guān)鍵行為,從而幫助開(kāi)發(fā)者達(dá)到用戶精細(xì)化運(yùn)營(yíng)和全生命周期管理的目的。

在這里需要注意的是,“個(gè)數(shù)”的行為預(yù)測(cè)與電商平臺(tái)常用的個(gè)性化推薦不同,后者主要是基于用戶近期的行為,如瀏覽記錄、購(gòu)買記錄而分析出用戶可能需要的東西,而“個(gè)數(shù)”是基于 App 各渠道卸載數(shù)、卸載趨勢(shì)等指標(biāo)的綜合分析,更多的是對(duì)人群的聚類分析,而非僅僅基于個(gè)人的行為。

行為預(yù)測(cè)的步驟

據(jù)“個(gè)推”大數(shù)據(jù)科學(xué)家朱金星介紹,“個(gè)數(shù)”的行為預(yù)測(cè)主要分為以下幾個(gè)步驟:

1、找樣本,主要從歷史數(shù)據(jù)庫(kù)中抽?。?/p>

2、特征抽取,將用戶與數(shù)據(jù)庫(kù)打通,做匹配;

3、特征篩選,保留相關(guān)性高的或有價(jià)值的特征;

4、模型訓(xùn)練,將保留下來(lái)的特征放到模型中訓(xùn)練,在模型的選用上,“個(gè)數(shù)”主要用了邏輯回歸,邏輯回歸的模型相對(duì)深度學(xué)習(xí)等其他模型來(lái)說(shuō),簡(jiǎn)單一些,而且在特征篩選上相對(duì)好處理,得到的結(jié)果好解釋,也相對(duì)穩(wěn)定。

5、參數(shù)優(yōu)化,根據(jù)效果進(jìn)行調(diào)整,如果結(jié)果不理想,即可返回調(diào)整參數(shù)重新走一次以上流程。

實(shí)例分析

下面我們以付費(fèi)預(yù)測(cè)為例,為大家梳理一下具體的實(shí)現(xiàn)過(guò)程。

個(gè)數(shù)付費(fèi)預(yù)測(cè)的流程主要包括以下幾點(diǎn):

1、目標(biāo)問(wèn)題分解

明確需要進(jìn)行預(yù)測(cè)的問(wèn)題即付費(fèi)預(yù)測(cè),以及未來(lái)一段時(shí)間的跨度。

2、分析樣本數(shù)據(jù)

(1)提取出所有用戶的歷史付費(fèi)記錄;

(2)分析付費(fèi)記錄,了解付費(fèi)用戶的構(gòu)成,比如年齡層次、性別、購(gòu)買力和消費(fèi)的產(chǎn)品類別等;

(3)提取非付費(fèi)用戶的歷史數(shù)據(jù),這里可以根據(jù)產(chǎn)品的需求,添加條件、或無(wú)條件地進(jìn)行提取,比如提取活躍并且非付費(fèi)用戶,或者不加條件地直接進(jìn)行提取;

(4)分析非付費(fèi)用戶的構(gòu)成。

3、構(gòu)建模型的特征

(1)原始的數(shù)據(jù)可能能夠直接作為特征使用;

(2)有些數(shù)據(jù)在變換后,才會(huì)有更好的使用效果,比如年齡,可以變換成少年、中年、老年等特征;

(3)交叉特征的生成,比如“中年”和“女性”兩種特征,就可以合并為一個(gè)特征進(jìn)行使用。

4、計(jì)算特征的相關(guān)性

(1)計(jì)算特征飽和度,進(jìn)行飽和度過(guò)濾;

(2)計(jì)算特征 IV、卡方等指標(biāo),用以進(jìn)行特征相關(guān)性的過(guò)濾。

5、選用邏輯回歸進(jìn)行建模

(1)選擇適當(dāng)?shù)膮?shù)進(jìn)行建模;

(2)模型訓(xùn)練好后,統(tǒng)計(jì)模型的精確度、召回率、AUC 等指標(biāo),來(lái)評(píng)價(jià)模型;

(3)如果覺(jué)得模型的表現(xiàn)可以接受,就可以在驗(yàn)證集上做驗(yàn)證,驗(yàn)證通過(guò)后,進(jìn)行模型保存和預(yù)測(cè)。

6、預(yù)測(cè)

加載上述保存的模型,并加載預(yù)測(cè)數(shù)據(jù),進(jìn)行預(yù)測(cè)。

7、監(jiān)控

最后,運(yùn)營(yíng)人員還需要對(duì)每次預(yù)測(cè)的結(jié)果進(jìn)行關(guān)鍵指標(biāo)監(jiān)控,及時(shí)發(fā)現(xiàn)并解決出現(xiàn)的問(wèn)題,防止出現(xiàn)意外情況,導(dǎo)致預(yù)測(cè)無(wú)效或預(yù)測(cè)結(jié)果出現(xiàn)偏差。

其他場(chǎng)景如流失預(yù)測(cè)、卸載預(yù)測(cè)等,在流程上與付費(fèi)預(yù)測(cè)類似,所以在這里就不再一一介紹了。

有了精準(zhǔn)的行為預(yù)測(cè),運(yùn)營(yíng)者則可以將運(yùn)營(yíng)目標(biāo)進(jìn)行拆分、細(xì)化,具體到每個(gè)場(chǎng)景、每個(gè)流程,針對(duì)不同用戶采取不同的推廣渠道、運(yùn)營(yíng)策略。例如基于流失預(yù)測(cè),運(yùn)營(yíng)者能夠提前洞察到用戶流失行為,提早進(jìn)行干預(yù),通過(guò)個(gè)性化內(nèi)容推薦、消息推送等運(yùn)營(yíng)手段對(duì)即將流失的用戶進(jìn)行挽留,從而降低流失率。總的來(lái)說(shuō),在大數(shù)據(jù)行為預(yù)測(cè)的幫助下,運(yùn)營(yíng)者能夠更及時(shí)、更全面地了解用戶,從而達(dá)到精細(xì)化運(yùn)營(yíng)的目的。

關(guān)于未來(lái)

接下來(lái)“個(gè)數(shù)”還將在商品推薦等領(lǐng)域做更多的探索,例如開(kāi)發(fā)精準(zhǔn)的推薦技術(shù)等,也會(huì)不斷挖掘大數(shù)據(jù)的潛力,結(jié)合反饋的數(shù)據(jù)做進(jìn)一步的優(yōu)化,圍繞客戶提供的樣本數(shù)據(jù)做更深入的訓(xùn)練學(xué)習(xí)等,為開(kāi)發(fā)者提供更全面的大數(shù)據(jù)服務(wù),大家敬請(qǐng)期待。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI