(百度硅谷人工智能研究院總監(jiān)Adam Coates在EmTech Digital大會上發(fā)表演講)
騰訊科技 紀振宇 發(fā)自硅谷
“百度硅谷人工智能研究院的目標是創(chuàng)建我們認為至少能夠影響1億人的人工智能技術。”百度硅谷人工智能研究院總監(jiān)Adam Coates在本周舉辦的Emtech Digital大會上這樣表示,在會后接受騰訊科技專訪時,他表示,百度美國研究院的部分人工智能技術成果,實際上已經(jīng)應用在了很多產(chǎn)品中。
此外,他還證實了百度即將擴大硅谷研究院規(guī)模的消息,新的辦公區(qū)就在距離目前百度美國研究院不到一英里的位置。
“人數(shù)會在目前的基礎上再擴大約一倍左右?!盋oates說。目前,百度在美國研究院共有約200名員工。
上周,百度首席科學家吳恩達的突然離職,令外界對百度人工智能研究的未來發(fā)展產(chǎn)生新的疑問。百度方面宣布,總裁張亞勤將任百度美國研究院董事長,負責百度在美國研發(fā)中心的關鍵人才吸引、品牌建設、以及美研同國內(nèi)業(yè)務的戰(zhàn)略協(xié)同等方面的事務。
Adam Coates表示,自己在百度的工作性質并不會發(fā)生變化,依然會繼續(xù)此前的人工智能研究工作。在加入百度之前,他曾跟隨吳恩達在斯坦福大學從事人工智能方面的博士后研究。
“在出差到中國時,給我大的感受是所有事情的變化都非???,”Coates說,“和硅谷的節(jié)奏完全不同。”
他表示,百度從事人工智能研究的大背景時,對于很多發(fā)展中國家來說,移動互聯(lián)網(wǎng)的發(fā)展為人工智能時代鋪平了道路。
“如果你在2017年第一次連接上互聯(lián)網(wǎng),那么你很可能是從移動設備上進行連接的?!盋oates說。
他認為,正是基于人們互聯(lián)網(wǎng)連接方式的改變,將使得人機交互的方式也在同時發(fā)生變化。移動和物聯(lián)網(wǎng)將變成語音和人工智能的交互。
“在移動互聯(lián)網(wǎng)時代,我們需要全新的人機交互界面,”Coates說,“而語音就是我們所認為的能夠影響1億人的方式?!?/span>
百度硅谷研究院在過去幾年開發(fā)了Deep Speech技術,不同于傳統(tǒng)的語音識別系統(tǒng),Deep Speech完全運用了深度學習技術,通過成百上千小時的語音數(shù)據(jù)訓練后,實現(xiàn)對語音的識別。
此前,吳恩達在擔任百度首席科學家時曾經(jīng)介紹過Deep Speech系統(tǒng),他表示,過去對于識別不同的語言,需要做相應的針對不同語言的系統(tǒng),而運用了深度學習技術的Deep Speech系統(tǒng)則完全不需要對不同語言進行區(qū)別對待。“學習算法的通用性已經(jīng)可以不用區(qū)分不同的語言?!?/span>
目前,Deep Speech已經(jīng)推出第二代,Adam Coates表示,這套系統(tǒng)初全是用英語語音數(shù)據(jù)進行訓練,后來才引入了中文語音數(shù)據(jù)的訓練。
“因為這套系統(tǒng)完全是基于深度學習,完全取決于訓練數(shù)據(jù),所以我們可以很快地用中文語音數(shù)據(jù)來替換,并使其成為非常強的中文語音識別引擎?!盋oates說。
他介紹說,這套系統(tǒng)的訓練數(shù)據(jù)很龐大,加入了非常多的口音很重的中國方言數(shù)據(jù),而這些數(shù)據(jù)的訓練效果也很好,以至于很多人耳都難以聽清的方言語音,系統(tǒng)都能夠成功識別出來。
如今,百度的這套主要由美國人工智能研究院所開發(fā)的系統(tǒng),已經(jīng)成功實現(xiàn)了產(chǎn)品化。去年10月,一款名為TalkType的手機應用登陸安卓商店,這一應用便是基于Deep Speech的技術,是被百度稱為第一款真正意義上的“語音優(yōu)先”的輸入方式,而非鍵盤輸入之外的“語音輔助”的輸入選擇。
Coates認為,百度以及其他在中國從事人工智能研究的公司的大優(yōu)勢在于,中國互聯(lián)網(wǎng)用戶很快地接受了移動終端這樣的上網(wǎng)方式,無論是普通的收發(fā)郵件、瀏覽網(wǎng)頁,甚至是到餐館就餐,全部能夠用移動設備來完成,這些使用習慣與美國用戶完全不同,而這些給了例如語音識別等人工智能應用的廣泛的應用基礎。官方微博
官方微信公眾號
官方百家號