(網(wǎng)友見解)目前大數(shù)據(jù)風(fēng)控主要分為三類:
反欺詐模型
二元好壞模型
資產(chǎn)包風(fēng)控模型
一、反欺詐模型
大數(shù)據(jù)風(fēng)控只能用于小微資產(chǎn)(現(xiàn)金貸、消費貸、小微企業(yè)貸),而不可能用于基建、政信。對于小微資產(chǎn),還款能力不是核心問題,主要風(fēng)險是還款意愿。因此目前市面上大數(shù)據(jù)風(fēng)控90%的價值在于反欺詐。
反欺詐的大數(shù)據(jù)風(fēng)控主要基于兩套工具:交叉驗證、聚類分析。
交叉驗證主要是由人工判斷規(guī)則,系統(tǒng)校驗是否符合實際情況。如通訊錄和通話記錄校驗、電商記錄校驗、設(shè)備指紋校驗、多信息源地理位置校驗。以現(xiàn)金貸產(chǎn)品為例,大多數(shù)現(xiàn)金貸產(chǎn)品的基礎(chǔ)風(fēng)控邏輯就是兩個攝像頭,后攝像頭識別身份證,前攝像頭做人臉的活體識別,人臉對上身份證,就做好了反欺詐,之后就扔到二元好壞模型做評估。
聚類分析和交叉驗證的區(qū)別是,交叉驗證很多時候根據(jù)一些人工的規(guī)則,但是聚類分析主要是根據(jù)結(jié)果反向推導(dǎo)。比如通過歷史資產(chǎn)的履約情況,發(fā)現(xiàn)在19-25歲區(qū)間的人群風(fēng)險較低、發(fā)現(xiàn)輸入地址時間比較長的人群風(fēng)險較高、發(fā)現(xiàn)填寫收入在30000以上的風(fēng)險比3000以下還高。有的規(guī)則最后可以通過邏輯解釋,有的規(guī)則最后根本也無法理解為什么。但是如果一個新的進(jìn)件,和之前的「壞客戶」比較相似,那么他大概率是壞客戶。
以同盾為例,主要向資產(chǎn)、資金、支付、場景四方輸出反欺詐SaaS,提供:
交叉驗證工具
聚類分析報告
黑(灰)名單數(shù)據(jù)庫
二、二元好壞模型
二元好壞模型的核心價值是量化定價,包括授信額度、貸款期限、利率等。主要工具就是評分卡,先給用戶信用評分定級,然后不同級別不同利率。宜人貸分為ABCD類客戶,利率分別為17%、27%、34%、40%;Lending Club分為從A1-G5共35個級別,利率水平從6%到26%不等。(16年初數(shù)據(jù))
至于貸款額度,一般隨行就市。
個人現(xiàn)金貸:小額現(xiàn)金貸以隨行就市為基礎(chǔ),通過拍腦袋決定,在1000-5000不等。
個人消費貸:由于中國居民杠桿率較低,基本上3C、醫(yī)美、教育的資金需求都低于客戶授信額,因此直接使用交易金額就行。對于車貸行業(yè),一般也是簡單分檔,30萬以上車審核較嚴(yán),10萬以下車分36期,客戶還款壓力也不大。
小微企業(yè)貸:目前大數(shù)據(jù)應(yīng)用不多,主要因為小微企業(yè)造假動力強(qiáng),基礎(chǔ)數(shù)據(jù)都難以確保真實性。目前小微企業(yè)還是以抵押貸款、法人貸款、供應(yīng)鏈融資為主,信用貸主要還是依靠IPC方式通過線下業(yè)務(wù)員重制報表實現(xiàn)。電商類企業(yè)的風(fēng)控模型基本上是根據(jù)流水的比例來。
三、資產(chǎn)包風(fēng)控模型
上述都是基于單筆資產(chǎn)的方法論,但是從資產(chǎn)包層面的風(fēng)控有不同的考慮。
假設(shè)還款是1,逾期是0,不同的客戶有不同的表現(xiàn):
A:1111111111
B:0000000000
C:0011011101
A是好人,B是壞人,這兩個問題沒有異議。很多時候,基于前兩種模型我們會認(rèn)為C是壞人,但是從資產(chǎn)包層面,他提供了不菲的罰息收益。
此外,資產(chǎn)包的風(fēng)控還要考慮不同資產(chǎn)的相關(guān)性,考慮優(yōu)先劣后配比后的預(yù)期風(fēng)險改變,考慮流動性的風(fēng)險。
四、目前的市場格局和問題
第一個問題,長尾征信公司的價值。
放貸市場是碎片化的,但是征信服務(wù)提供商有規(guī)模效應(yīng),應(yīng)當(dāng)是集中的。也就是百融同盾兩家爭天下,芝麻信用、騰訊信用作為兩個數(shù)據(jù)庫對外輸出和輸入數(shù)據(jù)。
我搞不懂,在one or zero的市場環(huán)境下,為什么現(xiàn)在冒出那么多小的征信公司,還拿到融資,商業(yè)價值在哪里?尤其是像某些單一數(shù)據(jù)源的征信公司,我感覺被收購的價值都沒有,大公司不如坐等你死然后收編團(tuán)隊?這個問題我沒有答案,向各位專家請教。
第二個問題,過擬合問題。
信貸是周期性的,大周期小周期一堆。科技也是有周期性的,學(xué)生貸火起來,所有公司干學(xué)生貸,2年吃完整個市場,其他任何資產(chǎn)都面臨創(chuàng)業(yè)公司蜂擁而上的局面。
數(shù)據(jù)量有限的情況下,模型可能過度地學(xué)習(xí)訓(xùn)練數(shù)據(jù)中的細(xì)節(jié)和噪音,以至于模型在新的數(shù)據(jù)上表現(xiàn)很差,這意味著訓(xùn)練數(shù)據(jù)中的噪音或者隨機(jī)波動也被當(dāng)做概念被模型學(xué)習(xí)了。而這件事,在市場環(huán)境發(fā)生變化之前可能沒有任何人知道。
第三個問題,系統(tǒng)性風(fēng)險。
目前大數(shù)據(jù)風(fēng)控應(yīng)用最廣的是小額現(xiàn)金貸,因為他的數(shù)據(jù)反饋快(30天一反饋),因此比較容易做機(jī)器學(xué)習(xí)。市場上所有現(xiàn)金貸看下來,壞賬率約為4-8%,都是一開始8%或者更高,通過機(jī)器學(xué)習(xí)降低到4%左右。但這個數(shù)據(jù)其實意義不大,依然無法反駁復(fù)貸的擔(dān)憂:現(xiàn)金貸的借款人重復(fù)借款,本質(zhì)上每個借款人都成為一個小的龐氏騙局池。就像當(dāng)初和泛亞一起玩的經(jīng)紀(jì)公司都盈利,但是最后還是免不了崩盤,過度相信科技和數(shù)據(jù)也許是金融領(lǐng)域更大的風(fēng)險。