人工智能領(lǐng)域再度熱鬧起來(lái),這一次是因?yàn)橹悄苷Z(yǔ)音助手。
在百度推出DuerOS開放平臺(tái)后,國(guó)安廣視搭載DuerOS的新一代G2人工智能機(jī)頂盒及智能語(yǔ)音遙控器又落地河北。未來(lái)2年內(nèi),河北全省預(yù)計(jì)將有200萬(wàn)+用戶享受人工智能帶來(lái)的生活改變。與此同時(shí),阿里也推出一款內(nèi)置中文人機(jī)交流系統(tǒng)AliGenie的智能音箱,加上騰訊在此前推出的小微智能語(yǔ)音解決方案,智能音箱已然成為BAT的又一戰(zhàn)場(chǎng),而誰(shuí)能成為中國(guó)版的Echo也成為科技圈的一大談資。
可在業(yè)界看來(lái),阿里以及號(hào)稱要在八月份發(fā)布自己的智能音箱的騰訊,更像是智能語(yǔ)音領(lǐng)域一個(gè)遲到的“覺(jué)醒者”。距離亞馬遜Alexa的推出已經(jīng)有近兩年的時(shí)間,蘋果的Siri、Google的Assistant、微軟的Cortana等也在推出時(shí)間上占據(jù)優(yōu)勢(shì)。即便在國(guó)內(nèi),Fast Company 在去年年底就將百度排在具創(chuàng)新的 AI 和機(jī)器學(xué)習(xí)企業(yè)榜單第三位,僅次于 Google 和 IBM。百度深度語(yǔ)音識(shí)別系統(tǒng)Deep Speech2更是入選MIT 2016十大突破性技術(shù)。
正如第三方分析機(jī)構(gòu)Canalys分析師賈沫所說(shuō),智能音箱對(duì)人工智能技術(shù)要求很高。盡管目前語(yǔ)音識(shí)別方案較為完善,但是在深度學(xué)習(xí)等人工智能技術(shù)上并不是短時(shí)間內(nèi)能夠彌補(bǔ)的,只有深耕人工智能才有可能成為大玩家。
這次,百度的DuerOS走在了前面
巧合的是,在阿里推出“天貓精靈X1”的同時(shí),百度也在其AI開發(fā)者大會(huì)也首次系統(tǒng)闡述了百度對(duì)于AI語(yǔ)音交互領(lǐng)域的重視以及野心,以DuerOS開放平臺(tái)為支撐,試圖在AI領(lǐng)域再造安卓式的操作系統(tǒng)生態(tài)。
一個(gè)瞄準(zhǔn)了智能硬件,一個(gè)要做安卓式的操作系統(tǒng)生態(tài),與百度相比,阿里在智能語(yǔ)音交互領(lǐng)域的動(dòng)作還是晚了不少。
巨頭們紛紛瞄準(zhǔn)智能音響,在某種程度上確認(rèn)了科技領(lǐng)域的一個(gè)既定事實(shí),即語(yǔ)音將成為下一代交互入口之一,甚至?xí)谀承╊I(lǐng)域取代現(xiàn)有的圖像、動(dòng)作等人機(jī)交互方式。而想要實(shí)現(xiàn)這一宏偉目標(biāo),僅靠智能音響這一純粹的硬件產(chǎn)品恐怕是難以實(shí)現(xiàn)的,畢竟智能音響還需要經(jīng)歷數(shù)據(jù)積累、業(yè)務(wù)完善、云端服務(wù)部署等一系列流程。
阿里和百度不同的選擇,和兩家公司對(duì)人工智能的認(rèn)識(shí)不無(wú)關(guān)系。早在 2013 年年初,百度就成立了百度深度學(xué)習(xí)研究院(IDL),并在三個(gè)月之后在硅谷成立了硅谷人工智能實(shí)驗(yàn)室。而在當(dāng)時(shí),人工智能這個(gè)概念在業(yè)界方興未艾,大公司中也僅有百度等少數(shù)玩家嘗試進(jìn)行系統(tǒng)性的布局。隨著業(yè)界對(duì)人工智能領(lǐng)域在未來(lái)的不斷看好,科技巨頭們相繼改變了對(duì)人工智能的態(tài)度:如果你失去了這塊領(lǐng)地,那你也將失去未來(lái)。
從2014年開始,阿里、騰訊等開始陸陸續(xù)續(xù)布局人工智能領(lǐng)域,試圖跟上百度等先驅(qū)者的節(jié)奏,并導(dǎo)致智能語(yǔ)音交互成為彼此交鋒的戰(zhàn)場(chǎng)之一。只不過(guò),當(dāng)追隨者還在琢磨智能硬件作為發(fā)力方向的時(shí)候,百度的DuerOS已經(jīng)開始了開放生態(tài)的探索。
為什么說(shuō)生態(tài)才有未來(lái)?
BAT為何要把戰(zhàn)火燒向了智能語(yǔ)音交互領(lǐng)域?一個(gè)公認(rèn)的說(shuō)法是,智能語(yǔ)音交互是基于語(yǔ)音輸入的新一代交互模式,因此也被視為是新的物聯(lián)網(wǎng)入口。
誠(chéng)然,作為一種新型的人機(jī)交互模式,智能語(yǔ)音交互可以實(shí)現(xiàn)人機(jī)對(duì)話,即通過(guò)說(shuō)話就可以得到反饋結(jié)果。將智能語(yǔ)音系統(tǒng)搭載終端硬件,在這樣的“配合”下,制造商們得以進(jìn)入家庭的每個(gè)角落:在客廳看電視,在臥室吹空調(diào),在廚房用冰箱,而這些也將成為物聯(lián)網(wǎng)時(shí)代下人機(jī)共處的具體場(chǎng)景。
換而言之,如果語(yǔ)音交互取得廣泛應(yīng)用,智能語(yǔ)音系統(tǒng)企業(yè)獲利的同時(shí),還將帶來(lái)從元器件到內(nèi)容服務(wù)全產(chǎn)業(yè)鏈的重構(gòu)。對(duì)此,百度也直接放言,對(duì)話式人工智能系統(tǒng)DuerOS將成為百度在下一個(gè)時(shí)代重回巔峰的核心。
然而,要實(shí)現(xiàn)這樣的場(chǎng)景,不僅需要深耕語(yǔ)音語(yǔ)義識(shí)別技術(shù),還需構(gòu)建完善的生態(tài)。從PC時(shí)代的Windows,到移動(dòng)互聯(lián)網(wǎng)時(shí)代的安卓和iOS,再到智能語(yǔ)音時(shí)代的百花齊放,巨頭們一直想要實(shí)現(xiàn)的就是打破信息孤島,而開放往往被證明是正確的答案。在人工智能時(shí)代有著同樣的商業(yè)邏輯,在系統(tǒng)級(jí)層面進(jìn)行開源和開放,吸引足夠多的服務(wù)和硬件合作伙伴,連接起更多的終端和數(shù)據(jù),終實(shí)現(xiàn)“萬(wàn)物互聯(lián)”的場(chǎng)景。
為了構(gòu)建生態(tài),百度做出了兩個(gè)重要舉措,一是收購(gòu)了專注語(yǔ)音喚醒和自然語(yǔ)音交互技術(shù)的人工智能創(chuàng)業(yè)公司KITT.AI,并相繼發(fā)布了DCS(DuerOS Conversational Service)和DBF(DuerOS Bot Framework)兩大基礎(chǔ)協(xié)議,使得DuerOS成為國(guó)內(nèi)軟硬一體的“全”解決方案;二是百度在硬件上跟科勝訊、英特爾、MTK、Rockchip、全志、RDA、Realtek、高通等公司合作推出了不同的開發(fā)套件,包括套件的個(gè)人版、輕量版、標(biāo)準(zhǔn)版以及開放電路板設(shè)計(jì)、開放結(jié)構(gòu)設(shè)計(jì)等完整一體化參考設(shè)計(jì),以吸引更多硬件廠商的加入。
百度的做法有何啟示?
當(dāng)然,在人工智能的風(fēng)口下,試圖從系統(tǒng)層面做開放的絕不止百度一家,包括科大訊飛、云知聲等也有所嘗試,但百度的做法押對(duì)了嗎?
百度將DuerOS開放平臺(tái)分為智能設(shè)備開放平臺(tái)、對(duì)話核心系統(tǒng)、和技能開放平臺(tái)三層。簡(jiǎn)而言之,對(duì)話系統(tǒng)提供算法能力,比如語(yǔ)音技術(shù)、自然語(yǔ)言處理技術(shù)、搜索技術(shù)、多輪對(duì)話技術(shù)等能力,以及知識(shí)圖譜等大數(shù)據(jù);技能層,整合了音樂(lè)、有聲、新聞、娛樂(lè)等10大類、100多種生對(duì)話技能和愛(ài)奇藝、懶人聽書這類第三方內(nèi)容資源,免費(fèi)開放給開發(fā)者;算法層就是上文所提到的幾種軟硬結(jié)合的解決方案。
不難理解百度的野心,通過(guò)這些開源的技術(shù)和服務(wù),開發(fā)者們可以實(shí)現(xiàn)不同場(chǎng)景的智能應(yīng)用,輕松設(shè)計(jì)出滿足自己需求的產(chǎn)品,而非局限在“音箱”的形式上。語(yǔ)音交互平臺(tái)搭載終端硬件,成就更多的智能產(chǎn)品,進(jìn)而搭建起良性的生態(tài)產(chǎn)業(yè)鏈,這才是百度現(xiàn)在和未來(lái)的發(fā)力重點(diǎn)。
能夠證明這一策略行之有效的,或許還是亞馬遜Echo的成功。Echo在發(fā)布之初似乎并不討市場(chǎng)喜歡,即便在音質(zhì)輸出和設(shè)計(jì)方面均不輸專業(yè)級(jí)產(chǎn)品,亞馬遜還推出了一套完整的音樂(lè)流媒體服務(wù)。而當(dāng)諸多的開發(fā)者接入Echo,亞馬遜也嘗試著將Alexa開放給更多開發(fā)者,使得這款智能語(yǔ)音助手更加“好玩”的時(shí)候,銷量便開始一路水漲船高。
DuerOS的討巧之處在于,只需要修改17行代碼,就可以在幾秒鐘內(nèi)把搭載亞馬遜Alexa的設(shè)備遷移到百度DuerOS,極大地方便了開發(fā)者的“陣地轉(zhuǎn)移”,尤其對(duì)國(guó)內(nèi)的開發(fā)者而言,而在這之前,整個(gè)過(guò)程至少需要五個(gè)研發(fā)人員花費(fèi)3到6個(gè)月的時(shí)間。百度度秘事業(yè)部總經(jīng)理景鯤也因此向開發(fā)者公開呼吁,在中國(guó)選擇DuerOS。
總的來(lái)看,BAT等巨頭們擁抱語(yǔ)音交互已經(jīng)是不爭(zhēng)的事實(shí),只是阿里在生態(tài)的搭建上則多少顯得有點(diǎn)瞻前顧后,雖然推出了AliGenie平臺(tái),但與百度DuerOS鼓勵(lì)第三方開發(fā)產(chǎn)品合作共贏不同,阿里的重心還是自家產(chǎn)品。而騰訊在這個(gè)領(lǐng)域還尚未形成清晰的戰(zhàn)略布局。以至于有業(yè)內(nèi)人士對(duì)此分析稱,從策略上來(lái)看,百度的DuerOS是大生態(tài)戰(zhàn)略,而天貓精靈X1等幾乎就是照抄Echo。
那么問(wèn)題來(lái)了,阿里和騰訊是否會(huì)二次覺(jué)醒,在智能語(yǔ)音呀領(lǐng)域再次跟著百度DuerOS的節(jié)奏走起來(lái)嗎?
官方微博
官方微信公眾號(hào)
官方百家號(hào)