智慧搜索數(shù)據(jù) 支撐“般若”平臺
“般若”一詞,是梵語Prajna的音譯,意為“終極智慧”、“辨識智慧”,專指如實認知一切事物和萬物本源的智慧。在紛繁復(fù)雜的現(xiàn)象中辨識萬物的本源,這是般若的本意,也是百度金融大數(shù)據(jù)風(fēng)控平臺的寓意:在紛繁的世界中,幫助更多金融機構(gòu)和合作伙伴,共同建立一個持續(xù)共贏的成長生態(tài)。百度金融“般若”大數(shù)據(jù)風(fēng)控平臺的辨識能力首先來自于百度的“智慧”數(shù)據(jù)。
通常來說,電商數(shù)據(jù)主要包括銷售數(shù)據(jù)、用戶購買行為數(shù)據(jù)、商品數(shù)據(jù)、客戶咨詢數(shù)據(jù)、售后服務(wù)數(shù)據(jù)、推廣投放數(shù)據(jù)、營銷活動數(shù)據(jù),以及網(wǎng)站整體運營數(shù)據(jù)等,其優(yōu)點是便于商品運營、用戶運營和產(chǎn)品運營,相較搜索大數(shù)據(jù)來說,維度少,數(shù)據(jù)特征相對集中。社交數(shù)據(jù)則擁有群體性、關(guān)系性特征,擁有整體社交用戶的90%,日均集納流量超過160億,優(yōu)點是可以對群體動態(tài)具有較為準確的預(yù)測性等,社交數(shù)據(jù)的缺陷在于存在一定的風(fēng)險和漏洞,如容易被人為操作,數(shù)據(jù)單一維度的造假容易,代價低。
BAT的數(shù)據(jù)各具特色,相比阿里巴巴在消費領(lǐng)域具有較強數(shù)據(jù),騰訊在社交領(lǐng)域占據(jù)優(yōu)勢,百度具有海量的搜索數(shù)據(jù)。由于百度擁有中國互聯(lián)網(wǎng)領(lǐng)先的流量資源,百度搜索大數(shù)據(jù)的特征是高維、稀疏的,數(shù)據(jù)涵蓋人口屬性、興趣關(guān)注、消費場景、常駐位置、信用評分、APP行為等,擁有豐富的維度可以做更精準的用戶畫像。
智慧服務(wù) 提供場景化一體化解決方案
在AI時代,金融業(yè)的痛點包括獲客難、技術(shù)升級快、風(fēng)控成本高等。在基礎(chǔ)數(shù)據(jù)上,金融領(lǐng)域普遍面臨樣本集群不大導(dǎo)致的數(shù)據(jù)高維、稀疏、小樣本的難題。
從行業(yè)面臨的痛點和挑戰(zhàn)上看,“般若”平臺通過百度獨有的數(shù)據(jù)特征和算法,提出了整體解決方法:百度的“般若”風(fēng)控平臺,可一一破解難題:百度的梯度增強決策樹可以聚合大數(shù)據(jù)高維特征,可以實現(xiàn)高維數(shù)據(jù)降維、增加風(fēng)險區(qū)分度;百度的深度學(xué)習(xí),將特征嵌入,利用關(guān)聯(lián)挖掘等解決數(shù)據(jù)稀疏問題?!皬?000+降維至400維,可將行為的風(fēng)險區(qū)分度有效提升5%+”,而基于百度數(shù)億級用戶數(shù)據(jù),通過圖計算,可將信用標簽傳遞,豐富信貸樣本。
通過AI技術(shù),百度金融對大數(shù)據(jù)進行處理、歸類,梳理出很多數(shù)據(jù)特征。例如,通過Boosting算法,對大量的數(shù)據(jù)觀測后進行學(xué)習(xí),通過函數(shù)表達,在這些高維的數(shù)據(jù)中可以總結(jié)出一些特征。有了這些特征,就基本可以定義一個用戶,無需把數(shù)據(jù)全部都集中在一起了。在數(shù)學(xué)上,這樣的表達也可以描述為,這些數(shù)據(jù)都被分類在各個分類器里面,只要掌握了分類器的函數(shù)表達,每一個分類器里面的數(shù)據(jù)差異就可以忽略了。
百度金融技術(shù)負責(zé)人許冬亮在2017年百度世界智能金融分論壇上展示了”般若”的成績單:在信用領(lǐng)域,央行征信數(shù)據(jù)加百度數(shù)據(jù)可以將客群的風(fēng)險區(qū)分度提升13%;在反欺詐領(lǐng)域,百度已擁有百億節(jié)點、五百億邊的關(guān)聯(lián)網(wǎng)絡(luò),可以提升識別騙貸團伙的成功率。
許冬亮表示,百度智能金融的目標是成為一家真正意義的金融科技公司,在實現(xiàn)初心的道路上,“般若”通過釋放百度金融的科技的能力,不斷實踐,讓它有能力逐步涉足到傳統(tǒng)金融機構(gòu)受制于風(fēng)控水平而無法涉足的領(lǐng)域,擴寬金融服務(wù)邊界,讓更多人享受到更優(yōu)質(zhì)、安全、高效的金融服務(wù)。
官方微博
官方微信公眾號
官方百家號