23號(hào)下午,北京開了一場關(guān)于智能語音技術(shù)的大會(huì),發(fā)布了目前前沿的智能語音技術(shù)。
這場大會(huì)就是百度語音開放平臺(tái)三周年主題活動(dòng)會(huì),百度首席科學(xué)家吳恩達(dá),代表研究團(tuán)隊(duì)發(fā)布了四大語音技術(shù)——情感合成、遠(yuǎn)場方案、喚醒二期、長語音方案,為開發(fā)者提供免費(fèi)接入入口。作為智能語音技術(shù)重要的應(yīng)用之一,百度手機(jī)輸入法會(huì)上正式發(fā)布新版本,利用深度整合語音識(shí)別等人工智能技術(shù),新增多項(xiàng)功能。未來的輸入法或許不再是簡單的輸入工具,而是全面成為“人機(jī)交互”的核心介質(zhì)。
百度首席科學(xué)家吳恩達(dá)在演講中介紹新版百度輸入法
百度首席科學(xué)家吳恩達(dá)在主題演講中表示,語音是人類交流、人機(jī)交互自然的方式,使用百度的語音識(shí)別系統(tǒng),用戶在手機(jī)端輸入就可以更快、更方便、更自然。新版百度輸入法以語音技術(shù)變革為核心,重磅推出語言轉(zhuǎn)文字功能、語音調(diào)取聯(lián)系人信息功能,結(jié)合人工智能自動(dòng)匹配表情,讓聊天更生動(dòng)有趣。
通過深度應(yīng)用新語音技術(shù),新版百度輸入法打造出一款不僅能夠聽懂用戶所言,更能讀懂用戶需求的智能應(yīng)用,讓輸入不再單調(diào)。在大會(huì)現(xiàn)場百度語音輸入法展臺(tái),參會(huì)嘉賓及媒體親身體驗(yàn)百度語音輸入法的新功能和效果。
據(jù)了解,新版百度輸入法“聯(lián)姻”語音技術(shù),基于Deep Speech系統(tǒng),以高達(dá)97%的語音識(shí)別率,在方言背景或者快語速等場景下,百度大腦語音識(shí)別比人類識(shí)別更準(zhǔn)確。在雜音比較多的環(huán)境下,比如車載環(huán)境下,可以達(dá)到92%—93%左右。新版百度輸入法結(jié)合語意分析,可精準(zhǔn)判斷出用戶輸入意圖。值得一提的是,百度智能輸入法還可根據(jù)語義語境,通過分析用戶語音,分析當(dāng)前情緒狀況,自動(dòng)為用戶匹配符合情緒的趣味表情,很好地彌補(bǔ)了因語音輸入文字時(shí)對語意表達(dá)的缺失。
此外,百度輸入法還可實(shí)現(xiàn)“語音指令”和語意識(shí)別查找聯(lián)系人。例如在語音輸入狀態(tài),輸入“給張瑋打電話”或“你知道張瑋電話嗎”,都將彈出電話撥打卡片,前者是通過語音指令直接查找,后者是通過語意的識(shí)別查找聯(lián)系人。新版本中還在聊天場景下新增搜索功能,邊搜邊聊,一鍵獲取關(guān)鍵詞信息。
百度語音輸入法依托百度在人工智能在語音識(shí)別、自然語言理解能力等方面的領(lǐng)先技術(shù)提升人機(jī)交互體驗(yàn),正在推動(dòng)語音輸入走向普及。作為百度人工智能應(yīng)用成果之一,百度輸入法將繼續(xù)在“人機(jī)交互”的技術(shù)之旅探索,實(shí)現(xiàn)與用戶的自然語言交流,創(chuàng)新更懂用戶需求的智能輸入法,為用戶打造有溫度、有情感的移動(dòng)應(yīng)用。
(來源:重慶晚報(bào))