close

大家好,我是才哥。

今天我們分享一篇用Python玩轉AARRR模型的文章,告訴你如何把「機器學習算法」和「商業數據分析項目」捏合在一起。

(文末留言贈書)

數據分析,曾經是一個特定崗位,現在也可以說是一種通用能力。無論你業務崗,還是技術崗,都得會點兒。求職時,你會發現,什麼職位都會要求你具備數據分析能力。而具備數據分析能力的你,可以在面試過程中自我展示,也會大幅增加你的職場競爭力。

而機器學習,則是人工智能時代的另一種硬核能力。與數據分析相比,機器學習則似乎顯得更加高大上一些,似乎需要更多的數學知識和技術編碼能力,學起來有點令人望而生畏。

隨便找一張機器學習的常用算法表就會是下面這樣式兒的。

這麼多的算法有點勸退,所以對於一般做數據分析的人來說,還不敢輕易入坑機器學習。

不過,以我在商業諮詢公司和研究所里多年的項目經驗來看,在大量的數據分析相關項目中,一定會有機器學習算法出場的,躲也躲不掉。而且,使用這些機器學習算法,其實也沒有什麼難度。畢竟,我們做項目只是把算法拿過來用,而不是從頭開始設計實現算法。最關鍵的,仍然是你要知道什麼算法,適合於什麼樣的數據分析項目。

下面我就用幾個例子,告訴你如何把「機器學習算法」和「商業數據分析項目」捏合在一起。

例子1:用聚類算法給用戶畫像

先講講如何用一種無監督的機器學習算法給你的用戶做用戶畫像。

用戶畫像(user profiling)簡單來說是在數據分析和運營過程中,對用戶的特徵或者屬性進行數據化的描述。在推廣獲客之前,先要做用戶畫像,了解用戶。

了解用戶的方式是搜集現有用戶的資料,記錄用戶的每一次消費行為。用戶數據的搜集有多 個維度,常見的維度包括靜態屬性(人口統計特徵)、動態屬性(消費行為特徵)、心理屬性等。

而機器學習中的聚類算法,則特別適合把相似的數據給組織到一塊去,因此也就特別適合用它來給用戶分組、分群、分類。

用通俗的語言解釋,聚類就是讓機器把數據集中的樣本按照特徵分組,這個過程中沒有標籤存在,因此,它是一種無監督學習算法。而這種無監督學習算法,能在無人指導的情況下,根據數據(如 R 值、M 值、F 值)把用戶分成幾組。—— 這就是大名鼎鼎的RMF分析。

R、F、M 的定義如下。

最近一次消費(R,Recency):也叫新近度,代表自用戶上次消費以來的天數;最近一次消費是非常有力的數據分析和預測指標。

消費頻率(F,Frequency):代表用戶是否頻繁使用服務,這也是用戶黏性的風向標。

消費金額(M,Monetary Value):用戶在一段時間內消費的總金額,這個指標的重 要性不言而喻。

將 R、F、M 組合在一起,就可以勾畫出一個用戶的整體輪廓。

那麼具體如何做呢?

第一步當然是收集與用戶消費頻率和消費金額相關的數據,並進行整理。

第二步,就是把整理好的數據對R、F和M分別做聚類。

第三步,是根據聚類結果給出每一個用戶的R、F和M層級的分值。

第四步,也就是最後一步,就是把R、F和M分值相加,就得到了每一個用戶的價值分組了。

怎麼樣,是不是特別簡單?

當然,因為篇幅所限,上面給出的只是核心步驟,如果你要知道全部的細節詳情,可以參考黃佳老師的這本新書《數據分析咖哥十話》。

例子2:用回歸算法預測客戶的生命周期價值

上面的聚類是一種無監督學習算法。也就是說,我們不需要給數據打任何標籤,機器學習算法會直接根據數據給我們做聚類。而機器學習中,更常見的算法則是監督學習算法,意思是在已經有了標籤的數據中擬合出一個函數,來預測未知的,沒有標籤的數據。

什麼意思?舉例來說更簡單。

假如我運營一個視頻號,10000個粉絲,那麼我就知道這10000個粉絲的性別,年齡,愛好等等數據。這些就是他們的特徵。那麼我當然還知道他們給我多少打賞的金額。這個打賞的金額——就是標籤。現在,來了一個新粉絲,尚且還不知道他未來會給我打賞多少,但是,他的性別,年齡,愛好等等數據,也已經知道了。這樣,我就能夠應用機器學習中的監督學習算法來預測她未來可能給我打賞的金額!

這就是用機器學習算法來預測客戶的生命周期價值(LTV,Life-Time Value)的基本原理!

而線性回歸(linear regression),它通過線性函數對變量間的定量關係進行統計分析,如廣告投入金額與新註冊用戶數就可能呈現線性關係。

而對於客戶生命周期價值來說,客戶的R值,F值,M值越高,那麼該客戶的LTV,也就是生命周期價值也就會越高,這兩者之間,也會呈現出明顯的線性關係。此時,R值,F值,M值就是監督式機器學習的特徵,而客戶的LTV就是標籤。

具體的項目實現步驟:

第一步,仍然是收集商業數據。

第二步,是根據業務數據,整理出每一個用戶的R值,F值,M值,以及LTV值。

第三步,是選定線性回歸算法,確定機器學習模型。

第四步,是擬合機器學習模型,讓他能夠模擬從特徵(R值,F值,M值)到標籤(LTV值)的關係。

第五步,也就是最後一步,就是用擬合好了的模型來預測LTV值了!

這也不難吧。

例子3:用分類算法來判斷客戶是否會流失

分類算法,也屬於監督學習算法。在商業數據分析項目中,分類算法有大量的應用。比如說:銀行的信用風險評估部門會預測一個客戶是否會存在欺詐行為,這就是分類(把客戶分成「正常」和「欺詐風險」兩個類)。

類似的,也可以通過監督學習算法來預測客戶是否會流失,而高流失風險的客戶就要進行重點的客戶關係管理。

要做一個判斷客戶是否會流失的項目,具體步驟如何呢?

第一步,還是首先收集數據。其中,前面用戶的各種屬性,是特徵,而最後一個字段,「已停付會費」則正是我們要預測的標籤。

第二步,可以通過留存曲線來顯示各個用戶特徵對於留存的影響。

第三步,就是建立分類模型,這裡我們選擇邏輯回歸模型,並根據數據擬合模型。

最後一步,用擬合好的模型來預測用戶是否會流失。

實際上,上面的內容,全部來自於埃森哲資深數據顧問黃佳的新書《數據分析咖哥十話 從思維到實踐促進運營增長》。

下面是廣告時間!

數據分析咖哥十話

這本書的寫法,令人耳目一新,其實用性令數據分析師們擊節讚嘆,很多數據分析高手讀後評論:

讀這本書時,有一種「抄作業」的輕鬆愉悅之感,讀着真的舒服。

如果早點讀到黃老師的這本書,將減少當初多少摸索式學習的痛苦。

這本書還有以下幾個特點:

1.立足實際

首先,這本書全書立足於數據分析項目實戰。書中內容架構按照全局到具體來安排,保證你每一步都知道怎麼走。基礎先行,宏觀掌握數據分析技能模塊;深度實踐,從頭到尾感受業務全流程。

2. 有趣又有料

這本書的設置是問題導向,用案例手把手帶着你解決實際業務。舉幾個例子如下:

(1)對於不同的用戶群體而言,同樣的廣告、推廣文案或 者促銷獲客活動有可能產生完全不同的效果。那麼推廣這款海報好不好?通過數據分析可以更好地來確定哪一類人才是真正的買家。

(2)在數據時代,流量是影響增長的重要因素。然而不計成本地獲客,可能會因陷入營收困境而功虧一簣。因此,討論如何獲客時,不能忽略對用戶價值的計算。清楚自己的用戶值多少錢,才能更好地知道自己能賺多少錢。

(3)如何找到更好的促銷渠道?如何量化各個渠道的具體價值?是否需要將多個促銷渠道結合,才能獲得更好的激活效果?我們將用馬爾可夫鏈來解決這些問題。如何將轉化結果歸因於多個營銷渠道顯得越來越重要了。一項研究表明,首次訪問零售商網站的消費者中有92%的人不在該網站購物。

(4)關鍵的營銷時刻是用戶真正開始使用產品,並且被產品所吸引的時刻。只有完成了一次從頭到尾的產品體驗之後,潛在用戶才真正成為「使用者」。如果這次體驗是令人滿意且愉悅的,那麼這個時刻就是我們所期望的「啊哈」時刻,也就是激活。激活的過程中哪個環節可能存在問題?需要數據的支持才能得出結論。

3. 培養數據思維

這本書中不僅有業務實戰案例,還囊括了數據分析的重要方法,邏輯思維模型,以及AARRR框架。全書都是圍繞着AARRR這個運營框架中的各個實戰環節而展開的。

(1)數據分析方法概述

在實踐過程中,數據分析師們總結出了許多具體的數據分析方法,了解這些方法的精髓,可將它們靈活應用於運營流程的各個階段。

1. 用戶畫像:多維拆解用戶信息

2. RFM分析:確定用戶的核心價值

3. 波士頓矩陣:協助企業分配資源

4. SWOT分析:揚長補短,實現目標

5. 5W2H分析:從多角度提問,發散思維

6. KANO模型:對用戶需求進行分類排序

7. 漏斗分析:顯示關鍵轉化節點

8. A/B 測試:對比不同方案

(2)邏輯分析方法

數據分析基本遵循提出問題→分析問題→提出假設→驗證假設→輸出結論這一過程,這個過程本身就需要多種邏輯思維方法的參與。因此,良好的邏輯思維能力對數據分析的作用不言而喻。

演繹推理就是從一般性原理出發 , 經過邏輯推理,從「已知」推知「未知」,以解釋具體事件或者現象。

(3)AARRR 模型

本書以 AARRR 模型為框架,以咖哥和小雪為主人公,給出 10 個用數據指導運營實踐的清晰案例。

4. 代碼硬核且活潑

這本書的不僅僅關注於理論,思維,實戰流程和方法。相關配套代碼的質量也是頂流的暖心。

看出來了吧,為了讓讀者真正學懂數據分析,做會運營實戰,作者可是真真正正下了功夫。從問題引入,到分析數據,到代碼實現。這樣一站式的服務,如果這樣還學不會數據分析,那真是有點辜負了咖哥的一片苦心......

黃佳老師的上一本書《零基礎學機器學習》,也是以咖哥為主人公,出版一年多以來,廣受讀者喜愛,已經是7次重印,豆瓣評分高達9.1分。作為一本入門書籍,實屬佳作。而《數據分析咖哥十話》一書,沿襲了風趣、幽默、輕鬆的風格,寫法上更上一層樓,把數據分析技術融入故事和實操當中,二者結合的更為巧妙。

那麼,這樣一本數據分析和運營實戰的精品書,正打折促銷,值得您入手一本。

贈書規則


贈送規則:通過留言點讚的方式送出,轉發本文至朋友圈+文末留言,留言點讚數量最多的第1位讀者將獲得1本,隨機抽1本。
附加規則:最近一個月中獎的本次不再送書,也給其他人一個中獎的機會!
開獎時間:9月1日20:00(周4)
注意事項:最終獲贈者請在24小時以內添加才哥微信👇,並提供朋友圈轉發和集贊的截圖。如發現機器或者非真實流量刷贊,發現後將進入黑名單,取消獲贈資格。
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()