導(dǎo)讀:本文將分享LTV 模型在用戶增長(zhǎng)上的應(yīng)用和搭建,主要介紹:
什么是 LTV?
LTV 可以解決什么問題?
什么時(shí)候需要什么樣的 LTV 預(yù)估?
如何實(shí)現(xiàn)設(shè)備粒度的LTV 預(yù)估?
LTV 如何應(yīng)用?如何撬動(dòng)更大的價(jià)值?
01什么是LTV
在傳統(tǒng)的經(jīng)濟(jì)學(xué)、市場(chǎng)學(xué)當(dāng)中,LTV經(jīng)常會(huì)被應(yīng)用的場(chǎng)景是:在一個(gè)超市中去分析來這個(gè)超市的人的整體的LTV,即LTV=Average Value of Sale *Number of Transactions * Retention Time Period,然后再做一個(gè)宏觀的數(shù)據(jù)統(tǒng)計(jì)和預(yù)測(cè)。
在互聯(lián)網(wǎng)的應(yīng)用環(huán)境下,通常把LTV拆解為兩項(xiàng):一個(gè)是LT(Life Time),一個(gè)是 ARPU(Average Revenue Per User)。通常在用戶生命周期的概念規(guī)范下,LT(Life Time)代表用戶在生命周期內(nèi)的活躍天數(shù);ARPU(Average Revenue Per User)是指用戶每次活躍時(shí)產(chǎn)生的價(jià)值;即LTV=LT(Life Time)*ARPU(Average Revenue Per User)。
02
LTV可以解決什么問題?
1. 用戶增長(zhǎng)中的生命周期
用戶增長(zhǎng)中的生命周期分為以下五個(gè)階段:
第一個(gè)階段是潛在用戶階段,即用戶還沒有成為你站內(nèi)的用戶;第二個(gè)階段,用戶成為你的站內(nèi)用戶,是一個(gè)新增用戶;第三個(gè)階段新增用戶可能會(huì)活躍,就會(huì)成為一個(gè)活躍用戶,一個(gè)活躍用戶有可能繼續(xù)活躍,也有可能流失:第四個(gè)階段,當(dāng)用戶流失掉的時(shí)候,就是一個(gè)已流失的用戶;第五個(gè)階段,流失用戶形成一個(gè)用戶增長(zhǎng)池,可以再去拉回用戶來提升整體的DAU。
2. LTV應(yīng)用于增長(zhǎng)的生命周期管理
LTV 模型可應(yīng)用于增長(zhǎng)的生命周期管理的五個(gè)階段。
(1)對(duì)于潛在用戶,可以通過一些站外的數(shù)據(jù)或者一些媒體側(cè)的增長(zhǎng)的數(shù)據(jù),去預(yù)估潛在的用戶或者潛在的設(shè)備的LTV價(jià)值的高低;此時(shí)使用的粒度比較粗,例如地域、男女等粗粒度的畫像特征。
(2)對(duì)于新增用戶,可以去構(gòu)建其畫像特征和行為特征等,來預(yù)估用戶在本次生命周期內(nèi)的 LT 和ARUP。
(3)對(duì)于活躍用戶,數(shù)據(jù)充足,體量大,可根據(jù)近 N 天的各種特征等去預(yù)測(cè)用戶在本次生命周期內(nèi)的LT和ARPU;活躍用戶的數(shù)據(jù)可以做到一個(gè)日粒度的更新,對(duì)應(yīng)的LTV價(jià)值預(yù)估可經(jīng)常刷新。
(4)當(dāng)活躍用戶流失之后,進(jìn)入到流失用戶池,需要預(yù)估用戶的潛在回流LTV價(jià)值,篩選出潛在回流LTV價(jià)值高的用戶。
(5)對(duì)于回流用戶,其LTV價(jià)值的分析跟新增用戶比較類似,即根據(jù)該用戶在本次回流的前 N 天的各種特征等去預(yù)測(cè)該用戶在本次生命周期的 LT 和ARPU。
3. 增長(zhǎng)策略在生命周期的應(yīng)用
LTV預(yù)測(cè)在增長(zhǎng)策略中如何應(yīng)用?還是從生命周期的五個(gè)階段依次拆解。
第一個(gè)階段是潛在用戶階段,如果知道潛在用戶的LTV價(jià)值,在買量時(shí),就可以進(jìn)行相應(yīng)的調(diào)價(jià):高價(jià)值的用戶出高價(jià),低價(jià)值用戶出低價(jià);從而可實(shí)現(xiàn)ROI優(yōu)化的目標(biāo)。
第二個(gè)階段是新增用戶階段,當(dāng)用戶來到站內(nèi)之后,可根據(jù)其前幾天的表現(xiàn)去調(diào)整其對(duì)應(yīng)的LTV價(jià)值預(yù)估,可以用于復(fù)盤該新增用戶的增長(zhǎng)策略做得好不好,也就是說當(dāng)用戶來到站內(nèi)以后,經(jīng)過一些時(shí)間行為的積累,預(yù)估其在本次生命周期的LTV價(jià)值,去衡量這次買量的效果好不好。比如說你花了5塊錢買了一個(gè)用戶,通過該用戶前幾天的一些表現(xiàn),預(yù)估該用戶在本次生命周期能夠產(chǎn)生比如10塊錢的收益,那么這次買量就是成功的、劃算的。
第三個(gè)階段是活躍用戶階段,可以每天刷新活躍用戶在本次生命周期的LTV價(jià)值,但此時(shí)也需要去關(guān)注和衡量一個(gè)用戶的長(zhǎng)期價(jià)值。在用戶增長(zhǎng)策略和方法中,經(jīng)常會(huì)發(fā)push拉活。比如用戶因?yàn)榘l(fā)push來到站內(nèi),那短期內(nèi)對(duì)DAU有增長(zhǎng),但同時(shí)預(yù)估其長(zhǎng)期的價(jià)值,可以知道這一次的促活能帶來的長(zhǎng)期價(jià)值是什么;這就衍生了白盒化分析的一些應(yīng)用,后面會(huì)有涉及。
第四個(gè)階段是流失用戶階段,首先在用戶流失之前,如果一直刷新活躍用戶的LTV價(jià)值預(yù)測(cè),識(shí)別出LTV價(jià)值的下降趨勢(shì),可以進(jìn)行流失預(yù)警;對(duì)于已流失的用戶,可以根據(jù)其潛在的LTV價(jià)值高低,然后拉回,和拉新的邏輯比較像,即在拉回策略上的一個(gè)優(yōu)化。
第五個(gè)階段是對(duì)于回流用戶的LTV預(yù)估,和新增用戶的LTV預(yù)估比較類似,就是根據(jù)拉回用戶的前幾天的站內(nèi)表現(xiàn),去回顧看一下這一次把這個(gè)用戶買回來,或者說是用一些策略吸引回來的,效率如何。
03
什么時(shí)候需要什么樣的LTV預(yù)估
到底需不需要一個(gè)LTV預(yù)估?在什么場(chǎng)景下要怎么樣進(jìn)行LTV預(yù)估?如何決策,和公司的發(fā)展策略、業(yè)務(wù)具體的應(yīng)用場(chǎng)景都是息息相關(guān)的,有很強(qiáng)的邏輯性,我們從以下四個(gè)維度進(jìn)行分析。
第一個(gè)維度是顆粒度,即需要對(duì)哪個(gè)顆粒度進(jìn)行LTV價(jià)值預(yù)估。
顆粒度,首先包括大盤,是今天活躍的所有設(shè)備,還是整體存量用戶庫(kù);然后包括某一個(gè)cohort,一個(gè)cohort是指特定編碼的用戶群或設(shè)備群,比如今天的新增設(shè)備可以是一個(gè)cohort,或者今天新增從某一個(gè)渠道買來的一批用戶也是一個(gè)cohort,可以對(duì)某一個(gè)cohort進(jìn)行LTV價(jià)值預(yù)估;最后包括設(shè)備/用戶,是LTV價(jià)值預(yù)估的終極模態(tài)。如果能夠差異化地預(yù)估每一個(gè)設(shè)備的LTV,應(yīng)用場(chǎng)景就非常的廣泛,可以把LTV價(jià)值預(yù)估聚合到任何維度,但是如果顆粒度越細(xì)的話,建模難度、誤差等就會(huì)越高;顆粒度太粗又無法滿足業(yè)務(wù)需求,因此一定要結(jié)合具體的業(yè)務(wù)應(yīng)用場(chǎng)景,去決定一個(gè)合適的顆粒度。
第二個(gè)維度是時(shí)效性,是指每一次做出預(yù)估的時(shí)候需要等待一個(gè)什么樣的周期才能預(yù)估出來本次生命周期的LTV,比如預(yù)估一年內(nèi)的LTV,等的時(shí)間越久,其實(shí)就越接近真實(shí)值,但要是等得太久的話,那業(yè)務(wù)不如再等兩天看真實(shí)值就算了,所以這里存在取舍,對(duì)于時(shí)效性要求越快的話,預(yù)估肯定是越不穩(wěn)以及越不準(zhǔn),但是越慢的的話,業(yè)務(wù)又不能滿足需求;因此還是需要要結(jié)合業(yè)務(wù)的應(yīng)用場(chǎng)景去決定時(shí)效性。
第三個(gè)維度是準(zhǔn)確性。
為什么準(zhǔn)確性是一個(gè)決定維度?比如LTV預(yù)估一個(gè)全量的值,如果真實(shí)值是100,要估100才對(duì),估98、95都不對(duì),這樣的標(biāo)準(zhǔn)太嚴(yán)格,因此在準(zhǔn)確性上需要有一定的取舍。尤其是在做設(shè)備粒度的LTV預(yù)估時(shí),有一些模型的效果是序會(huì)更準(zhǔn),比如A、B兩個(gè)設(shè)備,預(yù)估出來A設(shè)備比B設(shè)備的價(jià)值要高,但具體的準(zhǔn)確數(shù)值,可能估得不一定準(zhǔn);有一些模型的估值更準(zhǔn),比如聚合在某一個(gè)cohort上,這個(gè)估值的min會(huì)比較小,但序就不太準(zhǔn)了。更深入來分析,則可能需要在一個(gè)數(shù)據(jù)分布和建模選擇上進(jìn)行取舍,當(dāng)然需要結(jié)合具體業(yè)務(wù)需求去分析,如果評(píng)估實(shí)驗(yàn)組和參照組的差值,那序準(zhǔn)更重要,可以獲取設(shè)備之間誰大誰小的關(guān)系;如果是渠道買量等,就需要獲取某cohort、應(yīng)用或者設(shè)備的LTV價(jià)值,比如花了5塊錢買量,最終是不是產(chǎn)生了10塊錢還是15塊錢收益,那需要預(yù)估的LTV價(jià)值準(zhǔn);要根據(jù)應(yīng)用場(chǎng)景的不同做一定的取舍。
最后一個(gè)維度是用戶生命周期定義。
在傳統(tǒng)的市場(chǎng)學(xué)中,用戶生命周期是指用戶的壽命周期,就是完完整整的生命周期,buy until you die。但是在我們的業(yè)務(wù)應(yīng)用場(chǎng)景中,用戶生命周期會(huì)定義一個(gè)數(shù)字,有可能是一個(gè)月、一年,也有可能十年;具體是多長(zhǎng)時(shí)間會(huì)通過以下幾個(gè)因素進(jìn)行分析決定。
(1)公司的發(fā)展階段
如果公司發(fā)展到了比較成熟且穩(wěn)定的階段,則要關(guān)注用戶的長(zhǎng)期價(jià)值;如果在飛快發(fā)展的階段,歷史值都不太具有參考性,建模的穩(wěn)定性以及對(duì)于未來的預(yù)估的能力也不足;因此要根據(jù)公司發(fā)展階段來決定生命周期的長(zhǎng)短。
(2)宏觀經(jīng)濟(jì)地域環(huán)境
當(dāng)去預(yù)估一個(gè)設(shè)備或者一個(gè)渠道的價(jià)值時(shí),如果看的比較長(zhǎng)久一些,要考慮設(shè)備多久換一次機(jī),和換機(jī)時(shí)間是否能夠匹配上,其實(shí)也是buy until you die的邏輯,這個(gè)時(shí)候捕捉的就是設(shè)備的生命長(zhǎng)度;具體需要看多長(zhǎng)時(shí)間的周期就要根據(jù)宏觀的經(jīng)濟(jì)環(huán)境去決策。
(3)歷史數(shù)據(jù)積累
和第一點(diǎn)類似,不贅述。
(4)應(yīng)用場(chǎng)景
在某些應(yīng)用場(chǎng)景下是否需要和某些指標(biāo)對(duì)齊,那么也會(huì)影響用戶生命周期定義。
下面介紹幾個(gè)常規(guī)的LTV預(yù)估模型。
第一個(gè)模型是歷史值擬合。
針對(duì)某一個(gè)cohort或大盤,根據(jù)整個(gè)cohort或大盤的真實(shí)留存數(shù)據(jù),去擬合一個(gè)曲線y=a*ln(x)+b,預(yù)估出a和b的值,從而可以預(yù)估后續(xù)日期的LTV價(jià)值。
該模型的好處是應(yīng)用比較簡(jiǎn)單,簡(jiǎn)單清晰。弊端是穩(wěn)定性差,比如有一些激勵(lì)政策或前七天有促活,擬合出來的曲線就會(huì)有偏差,不是一個(gè)符合真實(shí)情況的成立函數(shù);也有可能中間有一些活動(dòng)帶來的一些尖刺spike,就會(huì)直接帶偏未來的預(yù)測(cè),需要等的時(shí)間比較久,通常等30天、60天都有可能,預(yù)測(cè)才能真的穩(wěn)定下來。
第二個(gè)模型是Probabilistic Model。
該模型將LTV拆解為L(zhǎng)T和ARPU,當(dāng)去看某個(gè)cohort或者大盤時(shí),假設(shè)這些指標(biāo)都是某種分布,然后根據(jù)歷史數(shù)據(jù)預(yù)估該分布的參數(shù),從而來預(yù)估未來的LTV,通常用于看大盤比較多。
最后一個(gè)模型是通過DNN或Machine Learning建模去構(gòu)建特征,包括用戶近N天畫像特征、行為特征、消費(fèi)特征、生產(chǎn)特征等,所有和業(yè)務(wù)、產(chǎn)品相關(guān)的維度,對(duì)用戶本次生命周期的LT和ARPU分別進(jìn)行預(yù)估。
下面從常理上剖析一下該模型。通過此類模型預(yù)估的LT和ARPU,實(shí)際上都面臨一個(gè)問題:大部分的用戶可能活躍一天或者花 10 塊錢就走了,有一部分用戶就花特別多的錢,但可能在尾部又出現(xiàn)一個(gè)spike,即20%的用戶貢獻(xiàn)80%的收入,這樣的分布建模的難度比較高,比如用平常的MAE當(dāng)loss的話,就不太容易能夠把這些極端的情況都捕捉到,可能會(huì)受比較奇怪的分布的影響,沒有辦法學(xué)到稀疏的地方。Google預(yù)估LTV的一個(gè)方法是沒有拆LT和ARPU,采用zero inflated log normal 模型直接預(yù)估一個(gè)用戶的LTV,具體可參考這篇文章:《Wang, X., Liu, T., and Miao,J. (2019), A deep probabil- istic model for customer lifetime value prediction, Available from: https://arxiv.org/abs/1912.07753》快手電商與增長(zhǎng)模型團(tuán)隊(duì)也創(chuàng)立了獨(dú)特的產(chǎn)業(yè)級(jí)LTV建模方法,通過引入Order Dependency Monotonic Network (ODMN)來針對(duì)時(shí)間跨度與LTV的有序依賴性建模,大幅提升模型表現(xiàn),同時(shí)使用基于分治法思路的Multi Distribution Multi Experts (MDME) 模塊式學(xué)習(xí),解決了LTV數(shù)據(jù)分布稀疏對(duì)建模的困難。詳見
04
如何實(shí)現(xiàn)設(shè)備粒度的LTV預(yù)估
如何實(shí)現(xiàn)設(shè)備粒度的LTV預(yù)估,總結(jié)下來就是數(shù)據(jù)和模型這兩塊。
數(shù)據(jù)基建是一個(gè)金字塔型階梯式的數(shù)據(jù)積累。
最底層是DAU的特征積累,即對(duì)DAU各種特征做數(shù)倉(cāng)建設(shè),對(duì)LTV的用途做模塊化管理,比如把生產(chǎn)側(cè)的某種指標(biāo)聚到一塊,實(shí)時(shí)地更新特征庫(kù)。
第二層是對(duì)不同cohort的模型圈選人群,其中cohort是指人群等,比如需要做設(shè)備粒度的LTV預(yù)估時(shí),預(yù)估模型需要圈選人群,該人群可能是MAU、DAU等,根據(jù)圈選出來的人群決定畫像和時(shí)效性。
第三層是聚集所有的特征,去得到訓(xùn)練/預(yù)測(cè)集等,就決定了特征的復(fù)雜性、模型的復(fù)雜性、訓(xùn)練更新頻率等。
第四層是線上的多維實(shí)時(shí)數(shù)據(jù)源,偏維度項(xiàng)、偏實(shí)時(shí)的數(shù)據(jù),即在模型預(yù)測(cè)或訓(xùn)練時(shí)才加進(jìn)來的一些比較簡(jiǎn)單的數(shù)據(jù)。最頂層最終預(yù)測(cè)輸出,預(yù)估的LTV價(jià)值。
模型基建分為三塊。
第一塊是只用一個(gè)模型框架承接整個(gè)探測(cè)數(shù)據(jù)、特征處理、訓(xùn)練、預(yù)測(cè),結(jié)果評(píng)估等完整流程,即該模型框架需要可以支持完整流程,并且有很強(qiáng)的拓展性,有一定的復(fù)用性。
第二塊是內(nèi)部有工具去部署任務(wù)、管理機(jī)器資源等,無論是用airflow,還是內(nèi)部自研的工具。
最后一塊是日常監(jiān)控,包括預(yù)測(cè)異常監(jiān)控、模型準(zhǔn)確率監(jiān)控、特征變化監(jiān)控,比如監(jiān)控是否準(zhǔn)時(shí)產(chǎn)出、特征變化等,監(jiān)控特征是不是從某個(gè)時(shí)候開始偏移了,整個(gè)分布都變了,則對(duì)應(yīng)模型不再適用,因此都要從各個(gè)維度,比如預(yù)測(cè)的結(jié)果、模型的準(zhǔn)確性,還有特征等都要做監(jiān)控。
05
LTV如何應(yīng)用?如何撬動(dòng)更大的價(jià)值?
最后介紹一下LTV如何應(yīng)用以及如何撬動(dòng)更大的價(jià)值。前面講過的白盒化和此相關(guān),通過模型可以榨取出白盒化的一些產(chǎn)品洞見。
對(duì)新增用戶進(jìn)行建模時(shí),可以做畫像切片,篩選出高價(jià)值的用戶,然后針對(duì)性地做一些買量策略;也可以預(yù)測(cè)時(shí)序上的變化,預(yù)估真實(shí)的LTV是怎么樣變化的,也可以預(yù)測(cè)具體的特征是怎么樣的變化及其正、負(fù)相關(guān)性等,因此可以對(duì)整體的產(chǎn)品策略有一定的指導(dǎo)。
對(duì)活躍用戶進(jìn)行建模時(shí),可以評(píng)估日常促活的一些策略的長(zhǎng)期價(jià)值,也可以分析該模型重要的特征,從而做一些產(chǎn)品策略的指導(dǎo)。如果知道決定活躍用戶預(yù)測(cè)重要的特征有哪些,可以對(duì)產(chǎn)品整體有宏觀的理解,并且從這些特征出發(fā),可以做更多的事情。比如相關(guān)特征涉及兩個(gè)產(chǎn)品線的一些重要指標(biāo),這兩個(gè)產(chǎn)品相互沖突和競(jìng)爭(zhēng),此消彼長(zhǎng),就可以知道哪個(gè)指標(biāo)對(duì)用戶的長(zhǎng)期價(jià)值更重要,也可以知道該如何看待兩個(gè)產(chǎn)品的重要指標(biāo),以及如何衡量其重要性。
還可以通過分析LTV預(yù)測(cè)的變化,得到生命周期變化的預(yù)警。比如長(zhǎng)期觀測(cè)一個(gè)用戶的LTV 預(yù)估的變化,可以找出LTV漲跌趨勢(shì),無論是漲還是跌,都可以映射到高活躍、中活躍和低活躍中,就可以獲得活躍用戶活躍度扭轉(zhuǎn)的預(yù)警。
對(duì)回流用戶進(jìn)行建模時(shí),和新增用戶類似,對(duì)于回流的用戶可以做策略優(yōu)化。比如通過做用戶畫像切片,可以知道已流失的用戶或拉回的用戶中哪些用戶的價(jià)值更高,然后針對(duì)性地優(yōu)化拉回策略。
今天的分享就到這里,謝謝大家。
來源:井冬萍 DataFunSummit
以上是關(guān)于用戶增長(zhǎng)師的相關(guān)信息,以供大家查看了解。想要了解更多用戶增長(zhǎng)師信息,第一時(shí)間了解用戶增長(zhǎng)師相關(guān)資訊,敬請(qǐng)關(guān)注唯學(xué)網(wǎng)用戶增長(zhǎng)師欄目,如有任何疑問也可在線留言,小編會(huì)為您在第一時(shí)間解答!