對(duì)以數(shù)據(jù)為核心資產(chǎn)的征信業(yè)來(lái)說(shuō),人工智能給行業(yè)發(fā)展帶來(lái)的增長(zhǎng)是不可限量的。前者會(huì)在兩個(gè)方面對(duì)征信產(chǎn)生無(wú)遠(yuǎn)弗屆的影響:一是在模式識(shí)別方面,主要解決交易場(chǎng)景中的身份識(shí)別問(wèn)題,且已取得了巨大成功;二是在信用分析及預(yù)測(cè)方面,主要解決客戶(hù)信用的風(fēng)險(xiǎn)評(píng)估問(wèn)題,目前尚在研發(fā)階段,預(yù)期未來(lái)發(fā)展?jié)摿薮蟆?/p>
互聯(lián)網(wǎng)經(jīng)濟(jì)要求新的個(gè)人信用使用方式
對(duì)個(gè)人身份進(jìn)行有效識(shí)別是征信機(jī)構(gòu)提供信用信息服務(wù)的前提條件。人工智能在生物識(shí)別方面的應(yīng)用近年取得的較大進(jìn)展,主要來(lái)自基于大數(shù)據(jù)的機(jī)器學(xué)習(xí),并在基于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)上實(shí)現(xiàn)了突破。以往,機(jī)器學(xué)習(xí)已成功應(yīng)用于垃圾郵件過(guò)濾、手寫(xiě)字符識(shí)別等在線(xiàn)下時(shí)代必須通過(guò)人力幫助判斷的領(lǐng)域,也有效解決了線(xiàn)上時(shí)代在機(jī)器翻譯、欺詐檢測(cè)、產(chǎn)品推薦等方面難以針對(duì)有效需求精準(zhǔn)完成的難題。但過(guò)去十年中,基于算法的演進(jìn)、大數(shù)據(jù)技術(shù)和計(jì)算機(jī)運(yùn)算能力的提高,特別是深度學(xué)習(xí)方式的開(kāi)發(fā),使得“機(jī)器”的智能顯著提高。
所謂“深度學(xué)習(xí)”,是機(jī)器學(xué)習(xí)中一種利用空間相對(duì)關(guān)系對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的新型機(jī)器學(xué)習(xí)模式,通過(guò)構(gòu)建深層人造神經(jīng)網(wǎng)絡(luò),組合多層硬件和軟件在層級(jí)間移動(dòng)大量數(shù)據(jù),每層都要根據(jù)學(xué)習(xí)內(nèi)容提供自己的數(shù)據(jù)表示方法,再將學(xué)習(xí)結(jié)果傳遞到下一層。當(dāng)前,人工智能=深度學(xué)習(xí)+大數(shù)據(jù),是一個(gè)最具時(shí)代精神、也最被普遍接受的認(rèn)識(shí)。
人工神經(jīng)網(wǎng)絡(luò)受1943年首創(chuàng)的人類(lèi)神經(jīng)網(wǎng)絡(luò)計(jì)算模型的影響而開(kāi)發(fā),并在1957年面世的感知器(Perceptron)系統(tǒng)中得到第一次軟件體現(xiàn)——一種基于雙層網(wǎng)絡(luò)的模式識(shí)別算法。但因計(jì)算能力有限而被棄,近年由于互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù)的出現(xiàn)而再度引起關(guān)注。
互聯(lián)網(wǎng)經(jīng)濟(jì)時(shí)代,金融服務(wù)會(huì)更多體現(xiàn)在場(chǎng)景模式的應(yīng)用中。機(jī)器深度學(xué)習(xí)通過(guò)在大數(shù)據(jù)中尋找“模式”,在這些模式的基礎(chǔ)上運(yùn)用一定算法再次統(tǒng)計(jì)分析,在毋須過(guò)多人工介入和人為干涉的情況下,利用分析所得預(yù)測(cè)事件結(jié)果。通過(guò)分析持續(xù)產(chǎn)生的越來(lái)越多的數(shù)據(jù),構(gòu)建并不斷完善預(yù)測(cè)消費(fèi)者行為的各種數(shù)學(xué)模型,在此基礎(chǔ)上進(jìn)一步生成“深度”計(jì)算模型,如此不斷深化及復(fù)雜化學(xué)習(xí)結(jié)果,從而使預(yù)測(cè)結(jié)果越來(lái)越趨近現(xiàn)實(shí)情況的演變。
在傳統(tǒng)商業(yè)模式中,征信機(jī)構(gòu)主要通過(guò)采集消費(fèi)者的證件號(hào)碼和姓名對(duì)消費(fèi)者身份進(jìn)行識(shí)別,如美國(guó)征信機(jī)構(gòu)采用社會(huì)保障號(hào)對(duì)消費(fèi)者身份進(jìn)行識(shí)別,我國(guó)人民銀行征信系統(tǒng)采用包括證件類(lèi)型、證件號(hào)碼、姓名在內(nèi)的三項(xiàng)標(biāo)示,并在征信報(bào)告查詢(xún)時(shí)引入其他問(wèn)題對(duì)消費(fèi)者身份進(jìn)行識(shí)別。但以上方式方法更適合在線(xiàn)下、低頻的交易模式中使用。對(duì)數(shù)據(jù)應(yīng)用強(qiáng)度、頻度、廣度均位居各行業(yè)前列的金融業(yè)來(lái)說(shuō),互聯(lián)網(wǎng)時(shí)代線(xiàn)上交易大量、頻繁、小額的特征,強(qiáng)烈要求出現(xiàn)與之相適應(yīng)的新的個(gè)人信用使用方式,以保證消費(fèi)者信息在進(jìn)行驗(yàn)證時(shí)的安全性和有效性均能夠受到保證。
生物特征識(shí)別是互聯(lián)網(wǎng)金融時(shí)代的“剛需”
相比通過(guò)身份證號(hào)碼進(jìn)行識(shí)別,使用消費(fèi)者個(gè)人生物特征進(jìn)行驗(yàn)證,過(guò)程更加可靠和安全。加上互聯(lián)網(wǎng)金融對(duì)風(fēng)控的強(qiáng)制要求和反欺詐中對(duì)身份識(shí)別的“剛需”,生物識(shí)別技術(shù)在一些新型金融機(jī)構(gòu)的業(yè)務(wù)應(yīng)用中已取得較好的進(jìn)展。其中,人臉識(shí)別技術(shù)最為吸引眼球,配合傳統(tǒng)的密碼、短信等安全驗(yàn)證手段,自帶活體檢測(cè)效果可有效避免以往因用戶(hù)個(gè)人信息泄漏造成的金融詐騙事件,為金融業(yè)的風(fēng)控手段增添了強(qiáng)有力的武器。
如圖1所示,在基于人體生物特征的模式識(shí)別(生物識(shí)別,Biometrics)中,對(duì)聲紋、人臉、指紋、虹膜和DNA五種識(shí)別技術(shù)進(jìn)行比較的結(jié)果,DNA識(shí)別的準(zhǔn)確率最高,但難以采集,聲紋識(shí)別的準(zhǔn)確率最低,卻最容易采集。其中,虹膜識(shí)別在穩(wěn)定性和準(zhǔn)確率上的表現(xiàn)均居中檔,是權(quán)衡成本應(yīng)用后在目前最具性?xún)r(jià)比的生物識(shí)別技術(shù)之一。2017年9月,支付寶和菜鳥(niǎo)在上海舉辦的物流開(kāi)放大會(huì)上宣布面向中小物流企業(yè)開(kāi)放從基礎(chǔ)的支付到中高的營(yíng)銷(xiāo)、信用、金融等能力。其在自提柜上即可實(shí)現(xiàn)的“刷臉取件”,采用的就是螞蟻金服基于Face++研發(fā)的人臉識(shí)別技術(shù)。在現(xiàn)場(chǎng)演示中中,自提柜只用5秒就完成了對(duì)取件人的身份驗(yàn)證過(guò)程。
人工智能主助力風(fēng)險(xiǎn)預(yù)測(cè)
不過(guò),對(duì)消費(fèi)者信用進(jìn)行評(píng)分作為涉及消費(fèi)者切身權(quán)益的半公共產(chǎn)品,不僅要有足夠的預(yù)測(cè)準(zhǔn)確率,還要具有可解釋性。人工智能技術(shù)雖然能提高信用評(píng)估的準(zhǔn)確性,但其學(xué)習(xí)過(guò)程非常復(fù)雜,甚至程序員也不能完全了解機(jī)器是怎樣學(xué)習(xí)的以及是如何通過(guò)學(xué)習(xí)得到結(jié)果的。這種“黑盒子”式的特點(diǎn)導(dǎo)致深度學(xué)習(xí)并不適于在個(gè)人信用評(píng)分方面的應(yīng)用,而使其在征信領(lǐng)域的普及受到挑戰(zhàn)。
相比之下,國(guó)外征信機(jī)構(gòu)和風(fēng)險(xiǎn)評(píng)估機(jī)構(gòu)對(duì)人工智能等先進(jìn)信息技術(shù)一直保持著高度關(guān)注,多年來(lái)投入大量人力、物力進(jìn)行研發(fā),并申請(qǐng)了相關(guān)專(zhuān)利。隨著人工智能技術(shù)的進(jìn)步,這些機(jī)構(gòu)也開(kāi)始嘗試引進(jìn)其他技術(shù)與人工智能合作,以在保持其預(yù)測(cè)準(zhǔn)確性的同時(shí)具有可解釋性,從而加快推進(jìn)人工智能技術(shù)在征信領(lǐng)域的商業(yè)化應(yīng)用。
一是在開(kāi)發(fā)信用卡流失模型時(shí),數(shù)據(jù)專(zhuān)家通過(guò)機(jī)器學(xué)習(xí)發(fā)現(xiàn)信用卡使用的新進(jìn)度和頻率之間的強(qiáng)大交互,將這種相互作用作為非線(xiàn)性特征以可解釋的方式納入評(píng)分卡后,即獲得“提升度(Lift)”指標(biāo)的顯著提升(約10%左右);通過(guò)機(jī)器學(xué)習(xí)應(yīng)用事件特定的與新進(jìn)度和頻率相關(guān)的一組組合,可以獲得另外15%的性能提升。這些預(yù)測(cè)性改進(jìn)應(yīng)用到現(xiàn)實(shí)中,就可以轉(zhuǎn)化為投資組合的實(shí)質(zhì)利潤(rùn)增長(zhǎng),通過(guò)機(jī)器學(xué)習(xí)繼續(xù)獲得更準(zhǔn)確的目標(biāo)客戶(hù)保留策略。
二是在一個(gè)數(shù)據(jù)有限的房屋股權(quán)投資項(xiàng)目中,數(shù)據(jù)樣本中缺乏足夠的“壞賬”(不良貸款)導(dǎo)致出現(xiàn)了一些問(wèn)題。通過(guò)建立具有優(yōu)化超參數(shù)的基于機(jī)器學(xué)習(xí)的信用評(píng)分,確定是傳統(tǒng)評(píng)分卡技術(shù)導(dǎo)致丟失了大量信號(hào)。通過(guò)將機(jī)器學(xué)習(xí)技術(shù)與評(píng)分卡技術(shù)相結(jié)合而創(chuàng)建的解決方案,其性能(KS)相比傳統(tǒng)評(píng)分卡(見(jiàn)圖2)提高了約20%。
需盡快備戰(zhàn)征信領(lǐng)域的商業(yè)化應(yīng)用
以往,Google、亞馬遜、Netflix等數(shù)據(jù)驅(qū)動(dòng)型公司,利用大數(shù)據(jù)技術(shù)和機(jī)器學(xué)習(xí)將蘊(yùn)含在互聯(lián)網(wǎng)中的巨量商業(yè)財(cái)富發(fā)掘出來(lái),最終建成了今天的互聯(lián)網(wǎng)商業(yè)財(cái)富帝國(guó)。今天,以全球第二大個(gè)人征信機(jī)構(gòu)Equifax、美國(guó)個(gè)人消費(fèi)信用評(píng)估公司FICO和智能分析軟件公司SAS為例,都在利用人工智能技術(shù)改善數(shù)據(jù)分析的有效性和建模過(guò)程的自動(dòng)化,針對(duì)“利用人工智能和機(jī)器學(xué)習(xí)對(duì)信用評(píng)分的建模缺乏解釋性”這一挑戰(zhàn)進(jìn)行深入研究,力圖在提高評(píng)分模型的準(zhǔn)確程度的同時(shí)實(shí)現(xiàn)其可解釋性,推進(jìn)人工智能技術(shù)盡快實(shí)現(xiàn)大規(guī)模商業(yè)化應(yīng)用。
Equifax:開(kāi)發(fā)深度學(xué)習(xí)工具,申請(qǐng)相關(guān)專(zhuān)利
成立于1899年的全球第二大征信機(jī)構(gòu)Equifax,收集和分析了全球超過(guò)8.2億消費(fèi)者和9100萬(wàn)家企業(yè)的數(shù)據(jù),以開(kāi)發(fā)能夠提高信用評(píng)分的深度學(xué)習(xí)工具。Equifax開(kāi)發(fā)了一個(gè)基于神經(jīng)網(wǎng)絡(luò)的信用評(píng)分系統(tǒng),剝離了“黑盒子”,能夠提供算法的完全解釋?zhuān)總€(gè)輸入都可以映射到神經(jīng)網(wǎng)絡(luò)的隱藏層,并為此特地增加了針對(duì)進(jìn)入模型的數(shù)據(jù)提供相關(guān)意義解釋的標(biāo)準(zhǔn)。新的神經(jīng)網(wǎng)絡(luò)模型將預(yù)測(cè)能力提升了15%,而且所分析數(shù)據(jù)集的規(guī)模越大,分析的算法越復(fù)雜,結(jié)果的改進(jìn)就越大。原因在于,雖然“信用屬性”是影響個(gè)人信用評(píng)分的重要因素,如個(gè)人支票賬戶(hù)余額及過(guò)去6個(gè)月的使用情況等,但人工智能算法基于“數(shù)據(jù)驅(qū)動(dòng)”的學(xué)習(xí)而創(chuàng)建,這些數(shù)據(jù)并非從數(shù)據(jù)專(zhuān)家的假設(shè)或根據(jù)經(jīng)驗(yàn)產(chǎn)生的,而是在深入學(xué)習(xí)的過(guò)程中,基于更多歷史或“趨勢(shì)性”數(shù)據(jù)而創(chuàng)建的。這決定了人工智能將根據(jù)建模的目的來(lái)確定什么樣的算法是最有預(yù)測(cè)性的。
SAS:開(kāi)發(fā)深度學(xué)習(xí)的應(yīng)用接口
SAS成立于1976年,是一家對(duì)數(shù)據(jù)進(jìn)行分析、開(kāi)發(fā)和銷(xiāo)售的數(shù)據(jù)管理軟件公司。SAS創(chuàng)建的由可視化數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)工具生成的神經(jīng)網(wǎng)絡(luò)(見(jiàn)圖3)不僅為其數(shù)據(jù)挖掘工具增加了新的深度學(xué)習(xí)功能,還提高了深度學(xué)習(xí)的應(yīng)用接口,由數(shù)據(jù)來(lái)定義深度學(xué)習(xí)的下一步做什么。
FICO:將人工智能與傳統(tǒng)風(fēng)險(xiǎn)評(píng)估方法相結(jié)合
在提供信貸決策服務(wù)方面具有全球壟斷地位的FICO很早就開(kāi)始了對(duì)人工智能及其研發(fā)的布局。FICO將人工智能技術(shù)與成熟的信用評(píng)分技術(shù)相結(jié)合,建立在經(jīng)過(guò)時(shí)間考驗(yàn)的分析模型和評(píng)分卡上,通過(guò)人工智能技術(shù)驅(qū)動(dòng)實(shí)現(xiàn)更好的模型細(xì)分和特征生成,從而提高模型的性能。目前FICO正在研究開(kāi)發(fā)如何在保證評(píng)分模型可解釋性的前提下,利用人工智能技術(shù)進(jìn)行信貸特征選擇,并已取得了長(zhǎng)足的進(jìn)步。
發(fā)展智能征信的藍(lán)海和短板
人工智能技術(shù)除了能夠幫助征信機(jī)構(gòu)在對(duì)客戶(hù)身份進(jìn)行識(shí)別時(shí)可以提供新的更安全、有效的服務(wù)方式,還可以通過(guò)開(kāi)發(fā)替代數(shù)據(jù)挖掘客戶(hù)信用,促進(jìn)信貸市場(chǎng)發(fā)展,從而在風(fēng)險(xiǎn)可控的前提下實(shí)現(xiàn)普惠金融落地。
比如,目前在全球征信行業(yè)中普遍存在的一個(gè)問(wèn)題是,很多新興市場(chǎng)國(guó)家在傳統(tǒng)征信記錄方面非常薄弱或呈缺失狀態(tài)。據(jù)世界銀行統(tǒng)計(jì),這與當(dāng)?shù)?3億消費(fèi)者中的約20億人口既沒(méi)有得到過(guò)銀行服務(wù),也沒(méi)有與銀行發(fā)生過(guò)任何關(guān)系有直接關(guān)系。此外,全球還有超過(guò)13億人口雖然與銀行有過(guò)一些聯(lián)系,但同樣沒(méi)有任何信貸記錄,這些消費(fèi)者主要集中在非洲和亞洲的新興市場(chǎng)國(guó)家。人工智能并不能直接為這些缺乏足夠信貸數(shù)據(jù)的消費(fèi)者提供信用服務(wù)或評(píng)估其個(gè)人信用價(jià)值,但人工智能技術(shù)可以幫助那些信用檔案中記錄有其他活躍信息的消費(fèi)者,通過(guò)對(duì)其他非傳統(tǒng)信貸數(shù)據(jù)如電信、公用事業(yè)賬單等支付歷史對(duì)消費(fèi)者進(jìn)行信用分析,檢測(cè)這些新數(shù)據(jù)源中潛在的最重要模式,并允許其他信貸機(jī)構(gòu)在針對(duì)該消費(fèi)者構(gòu)建風(fēng)險(xiǎn)評(píng)估方法時(shí)能夠通過(guò)網(wǎng)絡(luò)捕獲這些模式。
谷歌公司旗下的網(wǎng)站數(shù)據(jù)統(tǒng)計(jì)服務(wù)ID Analytics在利用人工智能技術(shù)作欺詐預(yù)防和信用風(fēng)險(xiǎn)評(píng)估時(shí),也發(fā)現(xiàn)人工智能可以幫助那些僅擁有部分信用記錄的消費(fèi)者得出相對(duì)良好的信用評(píng)分結(jié)果。因?yàn)槿斯ぶ悄芗夹g(shù)在針對(duì)消費(fèi)者信用檔案中的負(fù)面信息深入挖掘以尋找其他替代數(shù)據(jù)的過(guò)程中,發(fā)現(xiàn)不少消費(fèi)者其實(shí)具有很強(qiáng)的還款意愿,從而順利得出對(duì)這部分消費(fèi)者較為有利的信用評(píng)估結(jié)果。
值得注意的是,基于人工智能的身份驗(yàn)證技術(shù)目前仍在走向成熟的過(guò)程中,于項(xiàng)目的單獨(dú)應(yīng)用上還存在不少挑戰(zhàn),比如,2017年央視3·15晚會(huì)上,人臉識(shí)別技術(shù)就被五種方法分別實(shí)現(xiàn)了破解。對(duì)此,一種可行的解決辦法是采用多模識(shí)別模式,即針對(duì)不同金融交易場(chǎng)景各自的特點(diǎn)采用多因子認(rèn)證模式進(jìn)行身份驗(yàn)證。再如,由于生物特征識(shí)別技術(shù)會(huì)抓取一部分涉及消費(fèi)者個(gè)人信息的數(shù)據(jù),出于法律上對(duì)個(gè)人隱私的保護(hù),生物特征識(shí)別技術(shù)雖然已在全球范圍的征信機(jī)構(gòu)中得到或多或少的使用,但應(yīng)用于國(guó)家層面的目前僅在一些新興市場(chǎng)國(guó)家得到了實(shí)現(xiàn)。其中,總部位于南非的征信機(jī)構(gòu)康普斯坦(Compuscan)在烏干達(dá)建立的以指紋識(shí)別為基礎(chǔ)的身份識(shí)別系統(tǒng),通過(guò)在征信系統(tǒng)中建立公民指紋數(shù)據(jù)庫(kù),有效降低了個(gè)人身份被盜用的欺詐風(fēng)險(xiǎn)。
總之,征信業(yè)處在信息技術(shù)與金融服務(wù)的交叉領(lǐng)域,每一次技術(shù)的進(jìn)步和金融服務(wù)的改進(jìn)都促使征信系統(tǒng)完成又一次飛躍。隨著人工智能技術(shù)的深入應(yīng)用,互聯(lián)網(wǎng)經(jīng)濟(jì)時(shí)代的征信服務(wù)將會(huì)更加方便、安全和可靠;對(duì)征信大數(shù)據(jù)的深入挖掘,則不僅有利實(shí)現(xiàn)信用評(píng)估的自動(dòng)化發(fā)展,還能夠促進(jìn)發(fā)放更多可靠的貸款,通過(guò)人工智能普惠更多消費(fèi)者。
聯(lián)系客服