如何找到你的細(xì)分目標(biāo)用戶?
發(fā)布時(shí)間:2022-01-14 09:21 [ 我要自學(xué)網(wǎng)原創(chuàng) ] 發(fā)布人: 小劉2175 閱讀: 3264

我們最常用的細(xì)分用戶方式是聚類分析。但是如果你針對(duì)某一個(gè)關(guān)鍵指標(biāo),找到在這個(gè)指標(biāo)上差異最大的細(xì)分人群,可以試試用決策樹來細(xì)分用戶。

在近期的項(xiàng)目中,業(yè)務(wù)方提到了一個(gè)問題:因?yàn)閮?nèi)容的曝光量少,沒有很好的基礎(chǔ)數(shù)據(jù)作為推薦算法輸入,希望通過調(diào)研指導(dǎo)內(nèi)容投放的冷啟動(dòng),知道要給哪些特征的用戶投放哪些內(nèi)容。

針對(duì)這個(gè)問題如果只是單單分析一個(gè)特征的結(jié)果,可能會(huì)把一些重要的屬性組合淹沒在了特定人群中。比如舉一個(gè)不真實(shí)的例子,如果對(duì)用戶購買美妝產(chǎn)品行為進(jìn)行分析,只看男女?dāng)?shù)據(jù)分析,我們會(huì)發(fā)現(xiàn)相比于女性,男性幾乎是不購買美妝產(chǎn)品的。但是如果針對(duì)性別進(jìn)一步拆分年齡,我們會(huì)發(fā)現(xiàn) 95 后的男性也有較高的美妝購買行為,如果只看性別分析這個(gè)對(duì)美妝有高需求的特殊男性人群就會(huì)被忽視。

如何找到你的細(xì)分目標(biāo)用戶?試試這個(gè)決策樹!

但是可以分析的用戶屬性很多,如果手動(dòng)組合分析就非常的不方便。這個(gè)時(shí)候就可以用決策樹分析來解決這個(gè)問題。


什么是決策樹?


決策樹是一種細(xì)分用戶的方式。不同于聚類細(xì)分用戶,決策樹細(xì)分用戶中有一個(gè)目標(biāo)變量的概念。決策樹的細(xì)分目的就是通過逐層劃分不同解釋變量值獲得多屬性組合細(xì)分人群,使得細(xì)分人群在目標(biāo)變量上表現(xiàn)區(qū)隔度盡可能的大。

解釋變量就是用戶特征,比如人口學(xué)、消費(fèi)特征、用戶行為數(shù)據(jù)等。

目標(biāo)變量則是我們調(diào)研中關(guān)心的核心指標(biāo)。它有兩種類型,分別服務(wù)于兩種不同目的。

  • 描述目的:在市場(chǎng)調(diào)研中目標(biāo)變量一般是二分變量。比如在上述問題需求中,就是用戶對(duì)某個(gè)內(nèi)容是否偏好,通過決策樹我們可以知道有哪些特征組合的用戶群體對(duì)產(chǎn)品偏好度高,哪些更低。
  • 預(yù)測(cè)目的:這種情況下目標(biāo)變量是類別變量。比如目標(biāo)變量有四個(gè)值,分別代表 A\B\C\D 四個(gè)品牌,通過決策樹可以知道哪些特征組合的人群更偏好哪個(gè)品牌,可以輸出判別的規(guī)則作為預(yù)測(cè)模型。


決策樹的原理是什么?


決策樹算法中 CHAID 和 exhaustive CHAID 在結(jié)果的簡(jiǎn)潔度和區(qū)隔度上表現(xiàn)都更好是最常用的算法。而 exhaustive CHAID 與 CHAID 區(qū)別在于計(jì)算了更多的組合情況,可能獲得更好的分割,但本質(zhì)上兩者計(jì)算方式是統(tǒng)一的。因此本次就以 CHAID 為例進(jìn)行具體介紹。

CHAID 算法又稱卡方自動(dòng)交互檢測(cè)法。顧名思義,CHAID 就是自動(dòng)對(duì)解釋變量和目標(biāo)變量進(jìn)行交叉分析并進(jìn)行卡方檢驗(yàn),通過比較卡方檢驗(yàn)顯著性程度來尋找最佳細(xì)分維度。然后在此基礎(chǔ)上繼續(xù)細(xì)分直到卡方不再顯著或達(dá)到數(shù)生成的條件限制。最終輸出的樹如下圖 1。

輸出的決策樹結(jié)果向我們傳達(dá)了兩個(gè)重要的信息:

  • 樹結(jié)構(gòu)與分組情況:從結(jié)果圖上可以看到某個(gè)節(jié)點(diǎn)會(huì)根據(jù)解釋變量不同的取值細(xì)分為多個(gè)節(jié)點(diǎn)。該節(jié)點(diǎn)叫做父節(jié)點(diǎn),分節(jié)點(diǎn)叫做子節(jié)點(diǎn)。父節(jié)點(diǎn)和子節(jié)點(diǎn)構(gòu)成了決策樹的結(jié)構(gòu)。如果不再向下繼續(xù)劃分,則子節(jié)點(diǎn)稱為最終節(jié)點(diǎn),即最后的分組。最后分組的屬性即為到達(dá)這個(gè)最終節(jié)點(diǎn)的所有子節(jié)點(diǎn)屬性交集
  • 目標(biāo)變量分布:每一個(gè)節(jié)點(diǎn)都會(huì)顯示目標(biāo)變量分布。比如下圖中的節(jié)點(diǎn)一就表示一線城市的用戶中 73.5%都對(duì)這個(gè)權(quán)益感興趣。

如何找到你的細(xì)分目標(biāo)用戶?試試這個(gè)決策樹!

△ 圖 1 決策樹結(jié)果示意

有的時(shí)候決策樹會(huì)過于龐大復(fù)雜,可以通過設(shè)置樹的層級(jí)數(shù)、父節(jié)點(diǎn)、子節(jié)點(diǎn)最小樣本數(shù)來修剪決策樹:如果決策樹達(dá)到樹最大層級(jí)限制則不往下細(xì)分;如果節(jié)點(diǎn)樣本達(dá)不到父節(jié)點(diǎn)數(shù)量要求則不往下繼續(xù)分割;如果節(jié)點(diǎn)樣本數(shù)達(dá)不到單個(gè)子節(jié)點(diǎn)的數(shù)量要求即與其它節(jié)點(diǎn)合并。

但是如果從決策樹圖中找哪些最終分組是對(duì)目標(biāo)變量更感興趣的比較費(fèi)勁。所以決策樹除了輸出決策樹圖之外還可以輸出目標(biāo)類別收益表(比如內(nèi)容偏好中將有偏好設(shè)為目標(biāo)類別,示意見圖 2),收益表包含 4 個(gè)數(shù):

  • 節(jié)點(diǎn):指的是分組在節(jié)點(diǎn)中的百分比
  • 增益(收益):指的是分組目標(biāo)類別樣本在整體目標(biāo)類別樣本中的占比
  • 響應(yīng):該節(jié)點(diǎn)中回答目標(biāo)類別的人占該分組的比例
  • 指數(shù):增益/節(jié)點(diǎn)*100%,如果超過 100%說明該分組對(duì)目標(biāo)類別的偏好高于平均

如何找到你的細(xì)分目標(biāo)用戶?試試這個(gè)決策樹!

△ 圖 2 收益表示意

收益表將對(duì)目標(biāo)類別偏好度從低到高進(jìn)行排列,所以能很快找到哪些最終節(jié)點(diǎn)分組對(duì)目標(biāo)類別偏好度高。比如上圖就顯示節(jié)點(diǎn) 5 是對(duì)目標(biāo)變量最感興趣的人群。同時(shí)因?yàn)槭找姹磉包含了節(jié)點(diǎn)百分比,所以可以知道這些分組在整體市場(chǎng)中的大小,用于判斷可以將哪些分組包含進(jìn)來擴(kuò)大目標(biāo)人群范圍。比如上圖中雖然節(jié)點(diǎn) 5 是目標(biāo)變量最感興趣的群體,但人數(shù)較少,在整體市場(chǎng)中只占到 7.1%。所以我們可以將節(jié)點(diǎn) 5、16、1、12 都作為目標(biāo)群體,將市場(chǎng)覆蓋率提高到 37%。


SPSS 中如何操作?


1. 描述目的下如何操作

  • 數(shù)據(jù)準(zhǔn)備:每一行代表一個(gè)用戶樣本,數(shù)據(jù)包括目標(biāo)變量和所有的解釋變量。
  • 選擇決策樹:spss 分析à分類à樹
  • 輸入變量:將目標(biāo)標(biāo)量(如用戶對(duì)內(nèi)容偏好:偏好-不偏好)輸入到因變量中,解釋變量(如用戶屬性)輸入到自因變量中。因變量下方還有一個(gè)分類對(duì)話框,在其中將目標(biāo)變量的偏好勾選作為目標(biāo)值,該操作可以用于在后續(xù)輸出收益分析表。
  • 選擇建樹方式(增長(zhǎng)方式):默認(rèn)選擇 CHAID
  • 條件:可設(shè)置樹的最大層級(jí)、父節(jié)點(diǎn)和子節(jié)點(diǎn)的最小樣本數(shù)
  • 輸出:輸出的統(tǒng)計(jì)量里面可以選擇輸出收益表和收益圖

如何找到你的細(xì)分目標(biāo)用戶?試試這個(gè)決策樹!

△ 圖 3 描述目的決策樹面板操作說明

2. 預(yù)測(cè)目的下如何操作

如果是預(yù)測(cè)目的,前期計(jì)算設(shè)定操作與描述目的一致,但是還有模型風(fēng)險(xiǎn)估計(jì)和預(yù)測(cè)

  • 驗(yàn)證:如果是描述目的下,不需要進(jìn)行這個(gè)步驟操作。如果是預(yù)測(cè)目的下,可選擇進(jìn)行交叉驗(yàn)證。SPSS 會(huì)將樣本分為多個(gè)樣本組分別進(jìn)行決策樹計(jì)算并算出風(fēng)險(xiǎn)均值作為整體風(fēng)險(xiǎn)值。
  • 保存:在保存按鈕中可以選擇輸出預(yù)測(cè)值和預(yù)測(cè)概率。預(yù)測(cè)概率會(huì)輸出每個(gè)用戶在因變量各個(gè)取值上的預(yù)測(cè)概率,預(yù)測(cè)值會(huì)輸出該用戶在因變量是預(yù)測(cè)概率最大的值。

如何找到你的細(xì)分目標(biāo)用戶?試試這個(gè)決策樹!

△ 圖 4 預(yù)測(cè)目的下驗(yàn)證和保存預(yù)測(cè)變量操作


決策樹的應(yīng)用與局限


如果分析的目的就是希望能找到在目標(biāo)指標(biāo)上盡量差異明顯的細(xì)分人群,決策樹是一種不錯(cuò)的方式。如果是以聚類的方式細(xì)分,我們可以將目標(biāo)指標(biāo)作為其中一個(gè)細(xì)分輸入變量,但是因?yàn)榫垲愂菫榱俗層脩粼诳臻g的距離盡可能遠(yuǎn),目標(biāo)指標(biāo)可能并不是最重要的影響因素,所以最終的結(jié)果可能目標(biāo)指標(biāo)上用戶區(qū)分并不明顯。而決策樹的目的就是盡量在目標(biāo)變量上拉開差距,所以細(xì)分結(jié)果上差異會(huì)更加明顯。所以決策樹經(jīng)常被運(yùn)用在市場(chǎng)產(chǎn)品、品牌來定位最核心的目標(biāo)人群特征上。特別適合一開始業(yè)務(wù)方提出來的業(yè)務(wù)問題:特定內(nèi)容應(yīng)該給哪些用戶投放更加合適。

但是決策樹也有其局限和問題。

  • 相比聚類細(xì)分,決策樹只能設(shè)定一個(gè)目標(biāo)指標(biāo)。如果希望在兩個(gè)指標(biāo)上找到差異性較大的用戶就需要用聚類分析來實(shí)現(xiàn)。
  • 無法控制分組數(shù)量,非常容易細(xì)分出十幾組甚至更多的分組。分組數(shù)量增加后描述和理解成本都會(huì)增加。在市場(chǎng)人群細(xì)分和定位問題中我們不關(guān)心所有的分組,只關(guān)心最重要的那幾組,所以分組多不會(huì)帶來問題。而如果需要對(duì)整個(gè)目標(biāo)用戶進(jìn)行細(xì)分和理解,聚類能控制分類數(shù)量,是更加合適的方法。
PhotoshopCC2020視頻教程
我要自學(xué)網(wǎng)商城 ¥120 元
進(jìn)入購買
文章評(píng)論
0 條評(píng)論 按熱度排序 按時(shí)間排序 /350
添加表情
遵守中華人民共和國(guó)的各項(xiàng)道德法規(guī),
承擔(dān)因您的行為而導(dǎo)致的法律責(zé)任,
本站有權(quán)保留或刪除有爭(zhēng)議評(píng)論。
參與本評(píng)論即表明您已經(jīng)閱讀并接受
上述條款。
V
特惠充值
聯(lián)系客服
APP下載
官方微信
返回頂部
分類選擇:
電腦辦公 平面設(shè)計(jì) 室內(nèi)設(shè)計(jì) 室外設(shè)計(jì) 機(jī)械設(shè)計(jì) 工業(yè)自動(dòng)化 影視動(dòng)畫 程序開發(fā) 網(wǎng)頁設(shè)計(jì) 會(huì)計(jì)課程 興趣成長(zhǎng) AIGC