影像資料顯示人戴了口罩和帽子,且周圍光線黑暗
同樣是人機大戰(zhàn),同樣是機器戰(zhàn)勝人類,為什么AlphaGo取得了震驚世界的效果,而小度卻不斷被質(zhì)疑?其中一個很重要的原因就是播出方式不一樣,即使具備科學屬性,《強大腦》也不過只是一檔綜藝節(jié)目,經(jīng)過后期制作,播出的效果遠沒有直播帶來的震撼性和真實性。
而事實到底是怎樣的,我們也不得而知,這也不是我們今天討論的重點(感興趣的朋友可以上網(wǎng)搜索,網(wǎng)友和百度都給出了相關的說明)。我們今天要說的是,百度自稱在人臉識別算法國內(nèi)第一,有效的依據(jù)是什么?以及,在安防領域,人臉識別技術已經(jīng)達到了何種程度。
LFW和FDDB的排名有意義嗎
相信對人臉識別算法有研究的同學對LFW和FDDB也有一定的了解。LFW(Labeled Faces in the Wild)和FDDB(Face Detection Data Set and Benchmark)是全球權威的人臉識別檢測平臺,做人臉識別算法的公司,多多少少地會到LFW和FDDB上進行檢測。
LFW數(shù)據(jù)庫共有5749個人的13233幅圖像,其中1680人有兩幅及以上的圖像,4069人只有一幅圖像。FDDB和LFW一樣,都是馬薩諸塞大學的人臉數(shù)據(jù)庫,它包含2845張圖片,共有5171個人臉作為測試集。測試集范圍包括:不同姿勢、不同分辨率、旋轉(zhuǎn)和遮擋等圖片。
百度自稱人臉識別算法第一是因為,2015年,百度在LFW中曾達到99.77%的準確率,排名第一。而在2016年,小米和大華分別在FDDB和LFW數(shù)據(jù)集上拿下了第一的成績。
LFW和FDDB的權威性不容置疑,但是值得說明的是,由于LFW和FDDB的樣本是固定的,相當于一場考試,你已經(jīng)知道了題目,然后不停改進你的答案,這樣的刷分是沒有多大意義的。
安防領域的人臉識別有多大能耐
當我們談到人臉識別時,會出現(xiàn)兩個常見和重要的概念,即1:1和1:N。
簡單說來,1:1是一對一的人臉“核對”,解決的是“這個人是不是你”的問題,1:N是從眾多對象中找出目標人物,解決的是“這個人是誰”的問題。
人臉識別考勤、安檢時的身份驗證等應用都是1:1概念下的人臉識別應用。
而1:N更多的是用于安防行業(yè),比如在人流密集的場所安裝人臉識別防控系統(tǒng),它和1:1大的區(qū)別就是1:N采集的是動態(tài)的數(shù)據(jù),并且會因為地點、環(huán)境、光線等影響識別的準確性和效果。
一套基本的人臉識別布控系統(tǒng)會具備以下幾個功能:
(1)人臉捕獲與跟蹤功能
人臉捕獲是指在一幅圖像或視頻流的一幀中檢測出人像并將人像從背景中分離出來,并自動地將其保存。人像跟蹤是指利用人像捕獲技術,當指定的人像在攝像頭拍攝的范圍內(nèi)移動時自動地對其進行跟蹤。
(2)人臉識別計算
人臉識別分核實式和搜索式二種比對計算模式。核實式是對指將捕獲得到的人像或是指定的人像與數(shù)據(jù)庫中已登記的某一對像作比對核實確定其是否為同一人。搜索式的比對是指從數(shù)據(jù)庫中已登記的所有人像中搜索查找是否有指定的人像存在。
(3)人臉的建模與檢索
可以將登記入庫的人像數(shù)據(jù)進行建模提取人臉的特征,并將其生成人臉模板保存到數(shù)據(jù)庫中。在進行人臉搜索時,將指定的人像進行建模,再將其與數(shù)據(jù)庫中的所有人的模板相比對識別,終將根據(jù)所比對的相似值列出相似的人員列表。
因此,數(shù)據(jù)成為提升人臉識別算法性能的關鍵因素,很多應用更加關注低誤報條件下的識別性能,比如支人臉支付需要控制錯誤接受率在0.00001之內(nèi),因此以后的算法改進也將著重于提升低誤報下的識別率。對于安防監(jiān)控而言,可能需要控制在0.00000001之內(nèi)(比如幾十萬人的注冊庫),安防領域的人臉識別技術更具有挑戰(zhàn)性。
而隨著深度學習演進,基于深度學習的人臉識別將獲得突破性的進展。它需要的只是越來越多的數(shù)據(jù)和樣本,數(shù)據(jù)和樣本越多、反復訓練的次數(shù)越多,它越容易捕捉到準確的結(jié)果和給你準確的答案。所以,當一套人臉識別系統(tǒng)的設備,在全面引入深度學習的算法之后,它幾乎是很完美的解決了以前長期各種各樣的變化問題。
但即便如此,人臉識別技術依然面臨實際應用等諸多挑戰(zhàn),如何在各種復雜的場景中得到成功的應用還需要眾多的安防廠商共同努力。
官方微博
官方微信公眾號
官方百家號