在 [Customer Data Platform 是如何煉成的]中提到,Data Platform 透過洞察與發現 ( Insights Discovery )、貢獻與進化 ( Contribute Evolution) 以及異常偵測 ( Anomaly Detection) 組成一個周而復始的正向循環,讓資料提供具有貢獻的結果。
最近讀到 How to Optimize KPIs by Distilling Data With Machine Learning 這篇文章,原文中提及的例子: 利用 User Behavior 進行機器學習,最後產出一個具備評分的可交付名單,提供給營銷人員進行後續操作;詳細的部分請再點閱原文,以下我想分享閱讀後的心得。
費米估算
依據維基百科的描述
一個經典的費米問題的例子是費米提出的「在芝加哥有多少鋼琴調琴師」
比如說,我們會採用以下的假設
1. 大約有9,000,000 人生活在芝加哥。
2. 在芝加哥平均每個家庭有2個人。
3. 大約在20個家庭中有1個家庭需要定期鋼琴調音。
4. 定期調琴的鋼琴每年需要調整一次。
5. 每個調琴師大約需要2小時調琴,包括路上時間。
6. 每個調琴師每天工作8小時,一周5天,一年50周。
最後經過計算,大略的估算出 225 個調琴師在芝加哥;在這個問題的時空背景下,事實上, 一共有大約 290 名調琴師在芝加哥。
量化問題
在調琴師的問題中,在沒有任一組織或權威可以提供完整調琴師清單的情況下,從圍繞調琴師的因素進行分析與展開,對相關的條件訂下一個基準數據,再一步步逼近命題,最終估算出大略的人數;
而原文中「如何有效利用有限的營銷預算」,換個方式來描述問題則變成「將營銷預算投入給哪些消費者,可以取得最大成效」 : 這使得問題本身可以圍繞著「消費者」這個因素進行分析與展開,或許是分析使用者消費行為、或許是透過 RFM 來進行初步的分析,更可以導入消費者會員等級權益等額外資料進行輔助。
顯而易見,討論出一個有共識、覺得可行的方式將問題進行轉化,這就屬於洞察(Insights);而被提出的問題本身,則是被發現的異常(Anomaly)。原文最後提出「具有評分等級的使用者清單」則是貢獻(Contribute)。
有趣的是,當營銷人員依據清單進行預算投放後,便又能獲取新一輪的結果,這個結果除了可供驗證,同時也具備發現新異常的可能性。
背後的核心
同樣以調琴師的問題為例
是否曾考慮過,為什麼「在芝加哥有多少鋼琴調琴師」這個問題會被提出 ?
這就具備無限多種可能性,如 : 「目前有一個專供調琴師使用的產品,因此想知道芝加哥的市場規模」「芝加哥是否適合擴大鋼琴的販售規模」「如果想投身調琴師的職業,在芝加哥是否適合」 等等
與原文提出的「如何有效利用有限的營銷預算」一致,「怎麼做能夠提升營銷數字」「某類型的商品是否適合投放營銷預算」等等
我們希望借鑑成功案例時,不妨先試著共同討論
我們正面對著什麼樣的情況 ?
我們希望能改變什麼情況 ?
以更好的辨認目前的問題,屬於可以分析的「真議題」,或者只是展現一個虛榮數字的「假議題」