百度表示,Deep Voice 2可以“學(xué)習(xí)數(shù)百種不同的語音,從每個(gè)說話者那里吸收的數(shù)據(jù)不到半個(gè)小時(shí),但卻可以實(shí)現(xiàn)很高的音質(zhì)?!倍弦淮a(chǎn)品要達(dá)到類似的目的,每個(gè)聲音需要接受20小時(shí)的訓(xùn)練。在短短幾個(gè)月的時(shí)間內(nèi),該系統(tǒng)便在效率上進(jìn)一步超越谷歌WaveNet。
百度表示,與之前的TTS系統(tǒng)不同,Deep Voice 2可以完全憑借自己的能力找到進(jìn)行訓(xùn)練的語音之間的共同特點(diǎn),不需要接受任何事先指導(dǎo)。“Deep Voice可以學(xué)習(xí)并完美模仿數(shù)百種語音?!痹摴驹诓┛椭姓f。
百度還在一篇論文中總結(jié)道,該公司的神經(jīng)網(wǎng)絡(luò)只需要通過數(shù)百個(gè)不同的講話者吸收很小的聲音樣本便可創(chuàng)作很好的語音效果。由此看來,可能要不了多久就能聽到數(shù)字語音助手用更加自然的語音與我們交流。(書聿)
官方微博
官方微信公眾號(hào)
官方百家號(hào)