作為一名數(shù)據(jù)分析師,你又沒有發(fā)現(xiàn),自己經(jīng)常碰到一些棘手的問題就沒有思路,甚至懷疑自己究竟有沒有好好學(xué)過分析?
在上篇文章里,我們講到了數(shù)據(jù)分析中的流程、分類、對比三大塊,今天,我們繼續(xù)講剩下的3塊內(nèi)容。
4、關(guān)聯(lián)
看數(shù)據(jù)指標(biāo)不要只看一個“點”,還要看一條“線”上的前后連接的環(huán)節(jié),進(jìn)而從“面”或“體”的角度去看整個大環(huán)境中都有哪些因素相互作用。
對現(xiàn)象的分析可以參考簡單的調(diào)節(jié)模型:
其中:X是自變量,Y是因變量,M是調(diào)節(jié)變量。
尋找關(guān)聯(lián)關(guān)系時,不僅僅要找出對Y有直接影響的X(一個或者多個),還要找出影響X對Y作用的調(diào)節(jié)因素M。關(guān)聯(lián)也可以分為同時關(guān)聯(lián)和延時關(guān)聯(lián)兩類。
4.1同時關(guān)聯(lián)
即多個因素(X)同時發(fā)生作用一起促成了現(xiàn)象(Y)的發(fā)生。
e.g. 電商網(wǎng)站銷售的變化可能考慮的因素:
用戶:用戶結(jié)構(gòu)是否發(fā)生變化,是否有新的注冊渠道,新渠道導(dǎo)流進(jìn)來的用戶質(zhì)量如何;
商品:品類結(jié)構(gòu)是否有變化,e.g. 隨著四季變化,服裝類的種類也會發(fā)生變化;
產(chǎn)品:多少用戶使用舊版本或者新版本,產(chǎn)品某個環(huán)節(jié)有沒有改版,產(chǎn)品的策略(商品推薦策略等)是否有變化;
運營:前期的線上或者線下預(yù)熱,商城的優(yōu)惠力度,優(yōu)惠涉及的人群等;
4.2延時關(guān)聯(lián)
現(xiàn)象的產(chǎn)生可能存在延遲效應(yīng),要考慮當(dāng)前現(xiàn)象(環(huán)節(jié))的前置的“因”和后置的“果”。
e.g. 今天上線的營銷方案可能在幾天甚至幾十天后才會有顯著的效應(yīng),今天交易量上出現(xiàn)的波動也可能是因為一段時間前產(chǎn)品或者運營策略上有改動。
5、層級
要有結(jié)構(gòu)化、系統(tǒng)化的思維,對影響因素自上而下的拆解和自下而上的組合。
5.1自上而下的拆解
可以理解為“分級鉆取”,如同金字塔結(jié)構(gòu)一樣,先從總體看到二級分支,然后再看更細(xì)的分支。
e.g. 支付成功率的影響,可以對新老客、訂單來源、支付方式、銀行通道一層一層拆解,細(xì)化各個分支對整體變化的貢獻(xiàn)率;
e.g. 銷售額 = 下單人數(shù)*客單價 (a)
從登錄到下單是層層轉(zhuǎn)化后的,所以
下單人數(shù) = 訪客人數(shù)*瀏覽轉(zhuǎn)化率*購物車轉(zhuǎn)化率*支付轉(zhuǎn)化率 (b)
公式(b)代入公式(a),得到:
銷售額 = 訪客人數(shù)*瀏覽轉(zhuǎn)化率*購物車轉(zhuǎn)化率*支付轉(zhuǎn)化率*客單價
5.2自下而上的組合
就是將個體組成群體,將小的指標(biāo)組合成一個綜合指標(biāo)。
e.g. 用戶的標(biāo)簽分為基礎(chǔ)標(biāo)簽和復(fù)合標(biāo)簽,基礎(chǔ)標(biāo)簽就是單個用戶屬性來定義的(例如性別、婚否等),復(fù)合標(biāo)簽則是考慮多個基礎(chǔ)標(biāo)簽的組合(例如,某個典型的用戶群體畫像是:女性+單身+白領(lǐng)+一線城市);
e.g. 規(guī)劃用戶標(biāo)簽時,先用頭腦風(fēng)暴想出一批指標(biāo),然后進(jìn)行歸類、篩選、組合;
e.g. 風(fēng)控業(yè)務(wù)中累計壞賬計提的計算,是將不同的逾期資金規(guī)定不同的風(fēng)險計提比例,最后再把所有類別的風(fēng)險計提資金匯總起來,作為公司所有貸出款項的風(fēng)險計提資金,從而對公司貸款業(yè)務(wù)風(fēng)險進(jìn)行評估;
舉個形象的例子,自上而下好比國家財政撥款,從中央到省會再到各市縣區(qū);自下而上則像是國家征稅,就是從各市縣區(qū)、各企業(yè)層層匯總,直到報送國庫。
6、優(yōu)化
分析的最終目標(biāo)無非兩種:尋找解決方案,尋找更好的解決方案。第一步是保證數(shù)據(jù)的準(zhǔn)確性和穩(wěn)定性,第二步就是優(yōu)化,提高準(zhǔn)確性、提高效率和效益。
優(yōu)化包含兩部分的內(nèi)容:縮小當(dāng)前和目標(biāo)的差距,直到達(dá)成并超越目標(biāo);在成本或者預(yù)算固定的前提下,使收益最大化。
6.1縮小當(dāng)前和目標(biāo)的差距
e.g. 全公司各部門各業(yè)務(wù)線的同事們都在追逐和超越KPI的路上;
e.g. 機(jī)器學(xué)習(xí)建模時,嘗試多種方案,調(diào)試各種參數(shù),使模型的精確度逐漸提高。
6.2成本固定,最大化收益
e.g. 對于信用貸款產(chǎn)品而言,如果把“最安全”放在首位,那么極端的方式就是不給任何人發(fā)放貸款,這樣就不會出現(xiàn)壞賬了。正確的信貸模型思維是將壞賬控制在業(yè)務(wù)上可以接受的范圍內(nèi),并使利息覆蓋壞賬,進(jìn)而最大化收益。
任何商業(yè)模式都是追逐利益的,首要目標(biāo)是收益最大化,參考如下公式:
利潤 = 收入 - 投入成本 - 風(fēng)險損失
優(yōu)化的過程就是尋找利潤最大化的過程。
小結(jié):
以上總結(jié)了常見的6種數(shù)據(jù)分析思路,涉及具體的業(yè)務(wù)場景還要結(jié)合業(yè)務(wù)特點適當(dāng)變通。精通方法,深入業(yè)務(wù),勤于實踐,多加總結(jié),最終就能踏上描述-->解釋-->預(yù)測-->控制,步步高升的數(shù)據(jù)分析師精進(jìn)之路。