近日,國家知識產(chǎn)權(quán)局網(wǎng)站上公開了百度一系列針對移動(dòng)設(shè)備和服務(wù)的安全專利,專利內(nèi)容顯示,百度正試圖使用語音技術(shù)讓移動(dòng)用戶體驗(yàn)更加安全便利。
根據(jù)公開資料中的描述,該系列專利可“基于特定人的聲音特征提取相應(yīng)的特征碼,從而實(shí)現(xiàn)對用戶移動(dòng)設(shè)備、支付及其他互聯(lián)服務(wù)的無文本密碼登錄操作”。根據(jù)這幾份專利而形成的百度聲紋安全專利方案,很好地平衡了使用方便和保證安全兩個(gè)方面的需求,據(jù)百度語音研發(fā)團(tuán)隊(duì)透漏,該方案已初步應(yīng)用于手機(jī)百度,未來還將在貼吧、百度Hi等賬號登錄應(yīng)用及百度錢包等移動(dòng)支付系統(tǒng)上使用。
新專利完美平衡便利性和安全性
隨著語音技術(shù)的成熟和發(fā)展,聲紋識別已經(jīng)成為繼指紋識別之后又一基于生物特征的識別和鑒權(quán)技術(shù)。目前的聲紋認(rèn)證技術(shù)主要分為文本無關(guān)和文本相關(guān)兩種。文本無關(guān)的聲紋認(rèn)證技術(shù)對用戶說的內(nèi)容不加區(qū)分,而文本相關(guān)的聲紋認(rèn)證技術(shù)需要用戶說的內(nèi)容與注冊時(shí)必須一致,這兩種技術(shù)各有優(yōu)缺點(diǎn)。而百度的聲紋識別專利則結(jié)合了兩者的優(yōu)點(diǎn),采用了基于限定文本的聲紋驗(yàn)證,用戶在注冊階段說幾個(gè)固定的短文本,在認(rèn)證階段說有限個(gè)短文本的組合,從而實(shí)現(xiàn)具有一定文本自由度的聲紋認(rèn)證。
通過對多項(xiàng)專利技術(shù)的組合,百度提出了基于隨機(jī)數(shù)字串文本的聲紋驗(yàn)證模式,用戶設(shè)定聲紋特征時(shí)錄入10個(gè)數(shù)字的組合,并將其作為用戶個(gè)人的特征碼,當(dāng)用戶需要使用聲紋登錄或者支付時(shí),將會被要求讀出此前錄入的10個(gè)數(shù)字中的6個(gè)數(shù)字組合,系統(tǒng)將提取用戶讀出的6個(gè)數(shù)字組合的聲紋特征,并與此前錄入的特征進(jìn)行比對,如吻合則認(rèn)證成功。
此外,為了進(jìn)一步提高安全系數(shù),用戶還可以設(shè)定用特殊字符替代解鎖時(shí)顯示的某些數(shù)字,相當(dāng)于給聲紋解鎖再加上了一道密碼鎖。
實(shí)際應(yīng)用過程優(yōu)于現(xiàn)有技術(shù)方案
相比需要增加相應(yīng)硬件的指紋識別技術(shù),聲紋識別技術(shù)的優(yōu)勢在于幾乎所有設(shè)備都可以在無需增加識別設(shè)備硬件的前提下實(shí)現(xiàn)這一功能。依靠深度學(xué)習(xí)技術(shù)、大數(shù)據(jù)引擎和百度大腦的支撐,百度聲紋識別技術(shù)會記錄用戶每一次登錄的使用,并對特定用戶的聲音進(jìn)行建模和學(xué)習(xí),登錄次數(shù)越多,用戶的聲音模型越完整,對聲音識別的采集精確度越高,越不容易被盜用,進(jìn)一步提高了聲紋識別的整體安全性。
目前,BAT三家公司都已經(jīng)在自己的移動(dòng)服務(wù)上應(yīng)用了聲紋識別技術(shù)。例如微信新版升級之后就可以通過朗讀8個(gè)數(shù)字進(jìn)行聲紋特征匹配,之后就可以用這幾個(gè)數(shù)字進(jìn)行登錄。不過,騰訊采用的是固定數(shù)字,相比百度的隨機(jī)數(shù)字組合,固定數(shù)字很容易被錄音模仿和偽造。而如果要求用戶對每個(gè)數(shù)字進(jìn)行單獨(dú)錄音,則無法記錄特定用戶在朗讀連續(xù)數(shù)字時(shí)出現(xiàn)的連讀變調(diào)特征,導(dǎo)致實(shí)際使用中的特征比對失敗。另外,微信的登錄文本只要讀對一部分即可登錄,而百度聲紋識別需要有100%的準(zhǔn)確率才能打開相應(yīng)的應(yīng)用,更加安全便利。
此外,支付寶此前也在客戶端推出了聲波支付,在支付時(shí)手機(jī)發(fā)出固定的聲波頻率,由對方設(shè)備獲取后上傳服務(wù)器進(jìn)行比對,比對成功則可以完成支付。不過和百度聲紋技術(shù)鎖定的是用戶個(gè)人不一樣的是,支付寶的聲音特征是與手機(jī)進(jìn)行綁定的,如果用戶手機(jī)不在身邊,則無法完成付款,而百度聲紋技術(shù)則只要用戶本人在場,使用任何客戶端或移動(dòng)服務(wù)都可以完成支付,為用戶提供更便利的服務(wù)。
百度的這一系列聲紋識別專利,不僅是對已有技術(shù)研發(fā)成果的積極保護(hù),更重要的是將搶占語音技術(shù)戰(zhàn)略、語音產(chǎn)品戰(zhàn)略的制高點(diǎn),為百度引領(lǐng)行業(yè)技術(shù)與產(chǎn)品戰(zhàn)略走向奠定基礎(chǔ)。同時(shí),對“聲音”這一重要生物識別介質(zhì)的充分利用,將令百度系列產(chǎn)品的移動(dòng)體驗(yàn)更加便利安全,讓百度“技術(shù)改變O2O”的未來愿景,更引人遐想。