23號下午,北京開了一場關(guān)于智能語音技術(shù)的大會,發(fā)布了目前前沿的智能語音技術(shù)。
這場大會就是百度語音開放平臺三周年主題活動會,百度首席科學(xué)家吳恩達,代表研究團隊發(fā)布了四大語音技術(shù)——情感合成、遠場方案、喚醒二期、長語音方案,為開發(fā)者提供免費接入入口。作為智能語音技術(shù)重要的應(yīng)用之一,百度手機輸入法會上正式發(fā)布新版本,利用深度整合語音識別等人工智能技術(shù),新增多項功能。未來的輸入法或許不再是簡單的輸入工具,而是全面成為“人機交互”的核心介質(zhì)。
百度首席科學(xué)家吳恩達在演講中介紹新版百度輸入法
百度首席科學(xué)家吳恩達在主題演講中表示,語音是人類交流、人機交互自然的方式,使用百度的語音識別系統(tǒng),用戶在手機端輸入就可以更快、更方便、更自然。新版百度輸入法以語音技術(shù)變革為核心,重磅推出語言轉(zhuǎn)文字功能、語音調(diào)取聯(lián)系人信息功能,結(jié)合人工智能自動匹配表情,讓聊天更生動有趣。
通過深度應(yīng)用新語音技術(shù),新版百度輸入法打造出一款不僅能夠聽懂用戶所言,更能讀懂用戶需求的智能應(yīng)用,讓輸入不再單調(diào)。在大會現(xiàn)場百度語音輸入法展臺,參會嘉賓及媒體親身體驗百度語音輸入法的新功能和效果。
據(jù)了解,新版百度輸入法“聯(lián)姻”語音技術(shù),基于Deep Speech系統(tǒng),以高達97%的語音識別率,在方言背景或者快語速等場景下,百度大腦語音識別比人類識別更準確。在雜音比較多的環(huán)境下,比如車載環(huán)境下,可以達到92%—93%左右。新版百度輸入法結(jié)合語意分析,可精準判斷出用戶輸入意圖。值得一提的是,百度智能輸入法還可根據(jù)語義語境,通過分析用戶語音,分析當(dāng)前情緒狀況,自動為用戶匹配符合情緒的趣味表情,很好地彌補了因語音輸入文字時對語意表達的缺失。
此外,百度輸入法還可實現(xiàn)“語音指令”和語意識別查找聯(lián)系人。例如在語音輸入狀態(tài),輸入“給張瑋打電話”或“你知道張瑋電話嗎”,都將彈出電話撥打卡片,前者是通過語音指令直接查找,后者是通過語意的識別查找聯(lián)系人。新版本中還在聊天場景下新增搜索功能,邊搜邊聊,一鍵獲取關(guān)鍵詞信息。
百度語音輸入法依托百度在人工智能在語音識別、自然語言理解能力等方面的領(lǐng)先技術(shù)提升人機交互體驗,正在推動語音輸入走向普及。作為百度人工智能應(yīng)用成果之一,百度輸入法將繼續(xù)在“人機交互”的技術(shù)之旅探索,實現(xiàn)與用戶的自然語言交流,創(chuàng)新更懂用戶需求的智能輸入法,為用戶打造有溫度、有情感的移動應(yīng)用。
(來源:重慶晚報)