近日,百度大腦發(fā)布《2017年語音交互體驗(yàn)藍(lán)皮書》,為手機(jī)端語音交互產(chǎn)品的開封梳理行業(yè)規(guī)范。隨著語音識(shí)別準(zhǔn)確率的提升,語音交互成為許多產(chǎn)品的必備能力。其中手機(jī)上的語音交互作為人機(jī)交互的一個(gè)細(xì)分領(lǐng)域,已應(yīng)用于輸入法、搜索、地圖、購物、智能助手等APP。而如何完成語音指令、用戶體驗(yàn)是否優(yōu)質(zhì),則成為從業(yè)者在進(jìn)行語音交互設(shè)計(jì)時(shí)的挑戰(zhàn)。
百度大腦《2017年語音交互體驗(yàn)藍(lán)皮書》(下簡(jiǎn)稱藍(lán)皮書)一經(jīng)推出,便覆蓋了各行各業(yè),受到了眾多人群關(guān)注,僅微信平臺(tái)就引發(fā)了大量獲取需求,成為手機(jī)端語音交互體驗(yàn)探索的重要參考,也是該領(lǐng)域首個(gè)規(guī)范報(bào)告之一。
揚(yáng)長(zhǎng)避短 打造零障礙語音交互閉環(huán)
作為全球第一個(gè)結(jié)合用研、數(shù)據(jù)做分析,并從交互、功能設(shè)計(jì)上梳理的語音交互規(guī)范,藍(lán)皮書除了專業(yè)洞察外,不僅為開發(fā)者提供常規(guī)解決方案,還提供了案例參考,并對(duì)案例相關(guān)產(chǎn)品目前的用戶體驗(yàn)做了調(diào)研。調(diào)研顯示,語音識(shí)別的痛點(diǎn)是識(shí)別錯(cuò)誤及其后的修改。由于語音識(shí)別和打字輸入天然的差異,像糾錯(cuò)功能、學(xué)習(xí)反饋機(jī)制這些打字能夠輕松做到而語音還沒有做到的,就是解決問題的關(guān)鍵所在。
這些技術(shù)層面的理論其實(shí)與各行各業(yè)息息相關(guān)。藍(lán)皮書中舉了語音識(shí)別輸入法與地圖語音助手兩個(gè)實(shí)戰(zhàn)案例,案例中存在可能提高用戶體驗(yàn)的功能設(shè)計(jì)亮點(diǎn),如讓你拋棄鍵盤,體驗(yàn)飛一般輸入速度的語音輸入;能夠快速將用戶習(xí)慣使用的日??谡Z或網(wǎng)絡(luò)用語識(shí)別為正確結(jié)果的特殊學(xué)習(xí)、反饋機(jī)制等等。那么針對(duì)這些亮點(diǎn),藍(lán)皮書在功能設(shè)計(jì)方面從指令糾錯(cuò)功能與執(zhí)行體驗(yàn)、特殊機(jī)制的設(shè)計(jì)等角度提出了建議。
不難設(shè)想,隨著手機(jī)語音交互功能體驗(yàn)發(fā)展成熟,不僅將可以實(shí)現(xiàn)多種方言、多語種的即時(shí)交流,還將對(duì)傳統(tǒng)行業(yè)、輕工業(yè)、娛樂產(chǎn)業(yè)等帶來積極影響。
傳承人工智能技術(shù)基因 引領(lǐng)“可對(duì)話”的語音交互時(shí)代
手機(jī)語音交互體驗(yàn)需要從交互、技術(shù)性能、功能以及特殊機(jī)制,多角度全方位立體設(shè)計(jì)。而手機(jī)語音交互體驗(yàn)的優(yōu)化水平一定程度上決定了語音交互時(shí)代到來的速度。基于“符合直覺、快速及有趣”的IFF核心原則,百度大腦從多個(gè)角度去反思手機(jī)語音交互體驗(yàn),探索得出這套行業(yè)方案。
百度的語音交互能力是基于人工智能的技術(shù)基因,目前百度語音技術(shù)已集成語音識(shí)別、語義理解、深度問答、多輪對(duì)話、情感分析、語音合成等能力,語音交互能力在搜索、地圖等產(chǎn)品中均有體現(xiàn),并通過DuerOS賦能合作伙伴,開放能力,共同推進(jìn)產(chǎn)業(yè)發(fā)展。此次藍(lán)皮書的開放獲取,為更多從業(yè)者提供“規(guī)范捷徑”,為用戶帶來更好的語音交互體驗(yàn),也將整體提高行業(yè)水平。
在未來,智能設(shè)備、車載、聊天機(jī)器人等領(lǐng)域關(guān)于遠(yuǎn)場(chǎng)、喚醒、對(duì)話的語音交互研究也會(huì)越來越重要,這也將成為百度大腦下一步研究的計(jì)劃。
官方微博
官方微信公眾號(hào)
官方百家號(hào)