智慧搜索數(shù)據(jù) 支撐“般若”平臺
“般若”一詞,是梵語Prajna的音譯,意為“終極智慧”、“辨識智慧”,專指如實認知一切事物和萬物本源的智慧。在紛繁復雜的現(xiàn)象中辨識萬物的本源,這是般若的本意,也是百度金融大數(shù)據(jù)風控平臺的寓意:在紛繁的世界中,幫助更多金融機構和合作伙伴,共同建立一個持續(xù)共贏的成長生態(tài)。百度金融“般若”大數(shù)據(jù)風控平臺的辨識能力首先來自于百度的“智慧”數(shù)據(jù)。
通常來說,電商數(shù)據(jù)主要包括銷售數(shù)據(jù)、用戶購買行為數(shù)據(jù)、商品數(shù)據(jù)、客戶咨詢數(shù)據(jù)、售后服務數(shù)據(jù)、推廣投放數(shù)據(jù)、營銷活動數(shù)據(jù),以及網(wǎng)站整體運營數(shù)據(jù)等,其優(yōu)點是便于商品運營、用戶運營和產(chǎn)品運營,相較搜索大數(shù)據(jù)來說,維度少,數(shù)據(jù)特征相對集中。社交數(shù)據(jù)則擁有群體性、關系性特征,擁有整體社交用戶的90%,日均集納流量超過160億,優(yōu)點是可以對群體動態(tài)具有較為準確的預測性等,社交數(shù)據(jù)的缺陷在于存在一定的風險和漏洞,如容易被人為操作,數(shù)據(jù)單一維度的造假容易,代價低。
BAT的數(shù)據(jù)各具特色,相比阿里巴巴在消費領域具有較強數(shù)據(jù),騰訊在社交領域占據(jù)優(yōu)勢,百度具有海量的搜索數(shù)據(jù)。由于百度擁有中國互聯(lián)網(wǎng)領先的流量資源,百度搜索大數(shù)據(jù)的特征是高維、稀疏的,數(shù)據(jù)涵蓋人口屬性、興趣關注、消費場景、常駐位置、信用評分、APP行為等,擁有豐富的維度可以做更精準的用戶畫像。
智慧服務 提供場景化一體化解決方案
在AI時代,金融業(yè)的痛點包括獲客難、技術升級快、風控成本高等。在基礎數(shù)據(jù)上,金融領域普遍面臨樣本集群不大導致的數(shù)據(jù)高維、稀疏、小樣本的難題。
從行業(yè)面臨的痛點和挑戰(zhàn)上看,“般若”平臺通過百度獨有的數(shù)據(jù)特征和算法,提出了整體解決方法:百度的“般若”風控平臺,可一一破解難題:百度的梯度增強決策樹可以聚合大數(shù)據(jù)高維特征,可以實現(xiàn)高維數(shù)據(jù)降維、增加風險區(qū)分度;百度的深度學習,將特征嵌入,利用關聯(lián)挖掘等解決數(shù)據(jù)稀疏問題?!皬?000+降維至400維,可將行為的風險區(qū)分度有效提升5%+”,而基于百度數(shù)億級用戶數(shù)據(jù),通過圖計算,可將信用標簽傳遞,豐富信貸樣本。
通過AI技術,百度金融對大數(shù)據(jù)進行處理、歸類,梳理出很多數(shù)據(jù)特征。例如,通過Boosting算法,對大量的數(shù)據(jù)觀測后進行學習,通過函數(shù)表達,在這些高維的數(shù)據(jù)中可以總結出一些特征。有了這些特征,就基本可以定義一個用戶,無需把數(shù)據(jù)全部都集中在一起了。在數(shù)學上,這樣的表達也可以描述為,這些數(shù)據(jù)都被分類在各個分類器里面,只要掌握了分類器的函數(shù)表達,每一個分類器里面的數(shù)據(jù)差異就可以忽略了。
百度金融技術負責人許冬亮在2017年百度世界智能金融分論壇上展示了”般若”的成績單:在信用領域,央行征信數(shù)據(jù)加百度數(shù)據(jù)可以將客群的風險區(qū)分度提升13%;在反欺詐領域,百度已擁有百億節(jié)點、五百億邊的關聯(lián)網(wǎng)絡,可以提升識別騙貸團伙的成功率。
許冬亮表示,百度智能金融的目標是成為一家真正意義的金融科技公司,在實現(xiàn)初心的道路上,“般若”通過釋放百度金融的科技的能力,不斷實踐,讓它有能力逐步涉足到傳統(tǒng)金融機構受制于風控水平而無法涉足的領域,擴寬金融服務邊界,讓更多人享受到更優(yōu)質(zhì)、安全、高效的金融服務。
官方微博
官方微信公眾號
官方百家號