(百度技術(shù)委員會(huì)主席吳華博士)
作為機(jī)器翻譯及自然語(yǔ)言處理領(lǐng)域的權(quán)威專家,百度技術(shù)委員會(huì)主席吳華主導(dǎo)和參與多項(xiàng)自然語(yǔ)言處理的研究與開發(fā)工作,其豐碩的研究成果得到國(guó)際學(xué)術(shù)界的廣泛認(rèn)可,被《福布斯》專欄文章點(diǎn)評(píng)為“AI領(lǐng)域杰出女性”之一。此次出席2017全球人工智能技術(shù)大會(huì),吳華通過分享實(shí)際案例,深入淺出地介紹了自然語(yǔ)言處理技術(shù)的發(fā)展目標(biāo)及突破點(diǎn),并從四方面分享百度在自然語(yǔ)言處理領(lǐng)域的研發(fā)成果。
自然語(yǔ)言處理進(jìn)入發(fā)展繁榮期 知識(shí)圖譜和深度學(xué)習(xí)是助推器
自提出至今,人工智能發(fā)展已超過六十年。時(shí)下,大數(shù)據(jù)、知識(shí)圖譜、深度學(xué)習(xí)技術(shù)的發(fā)展以及計(jì)算能力的極大提升,使得人工智能迎來(lái)良好的發(fā)展機(jī)遇。近年,人機(jī)對(duì)話成為人工智能的熱門課題,進(jìn)一步推動(dòng)自然語(yǔ)言處理技術(shù)的發(fā)展。吳華認(rèn)為,自然語(yǔ)言處理的目標(biāo)是讓機(jī)器像人一樣思考,這要求機(jī)器可以做到:理解人類語(yǔ)言、用人類語(yǔ)言表達(dá)、具有感知和表達(dá)情感的能力、可以推理規(guī)劃決策,并具備學(xué)習(xí)進(jìn)化的能力。
吳華在現(xiàn)場(chǎng)為觀眾舉例說(shuō)明了具有思考能力的機(jī)器與傳統(tǒng)機(jī)器的區(qū)別。在機(jī)器翻譯中,如何正確理解上下文成為翻譯是否準(zhǔn)確的關(guān)鍵。比如翻譯“有困難找警察”,機(jī)器將“有困難”和“找警察”作為片段分別翻譯,并整合為“找警察很困難”,與原意相差甚遠(yuǎn),這主要是沒有理解原文導(dǎo)致的。
知識(shí)、記憶、推理等技術(shù)突破 加速“會(huì)思考的機(jī)器”到來(lái)
正如“黑白顛倒”的機(jī)器翻譯,缺少“思考”能力的機(jī)器“笑料百出”。要想使機(jī)器學(xué)會(huì)思考,在知識(shí)圖譜、長(zhǎng)時(shí)記憶、推理等技術(shù)上的突破很關(guān)鍵?,F(xiàn)場(chǎng),吳華從理解、推薦、對(duì)話、創(chuàng)作四個(gè)不同任務(wù),闡述了知識(shí)圖譜的重要性:基于知識(shí)圖譜的深度理解與滿足、基于意圖圖譜的對(duì)話系統(tǒng)、基于標(biāo)簽圖譜的智能推薦和基于主題規(guī)劃的機(jī)器人寫詩(shī)。
第一,基于知識(shí)圖譜的深度理解與滿足。吳華在現(xiàn)場(chǎng)提問 “竇靖童的妹妹是誰(shuí)”,和現(xiàn)場(chǎng)觀眾的思考相比,百度搜索可以實(shí)時(shí)得到正確答案。這是因?yàn)?,百度搜索?shí)現(xiàn)了基于知識(shí)圖譜的理解與滿足,機(jī)器能夠在事實(shí)性知識(shí)和概念性知識(shí)的基礎(chǔ)上進(jìn)行推理,通過人物“竇靖童”和關(guān)系“妹妹”得出思考的結(jié)果。
第二,基于意圖圖譜的對(duì)話系統(tǒng)。在現(xiàn)實(shí)生活中,很多用戶需求無(wú)法用單一問題描述清楚,多輪對(duì)話可以更好理解用戶意圖。吳華介紹,為更好滿足用戶需求,百度構(gòu)建了一套包含理解、生成、對(duì)話管理的對(duì)話系統(tǒng),基于用戶意圖進(jìn)行關(guān)聯(lián)引導(dǎo),并將意圖圖譜與機(jī)器學(xué)習(xí)深度結(jié)合,為用戶進(jìn)行精準(zhǔn)推薦。目前這一功能已經(jīng)在對(duì)話式人工智能操作系統(tǒng)DuerOS上應(yīng)用。
第三,基于標(biāo)簽圖譜的智能推薦。吳華現(xiàn)場(chǎng)展示了手機(jī)百度f(wàn)eed流的新聞推薦功能,圍繞用戶的搜索習(xí)慣,形成用戶興趣網(wǎng)絡(luò),并與文檔語(yǔ)義網(wǎng)絡(luò)相互映射形成標(biāo)簽網(wǎng)絡(luò),終得到“不搜即得、千人千面”的智能推薦。
第四,基于主題規(guī)劃的機(jī)器人寫詩(shī)?;诎俣茸匀徽Z(yǔ)言處理技術(shù)的“為你寫詩(shī)”,運(yùn)用業(yè)界首創(chuàng)的基于知識(shí)的主題規(guī)劃和寫詩(shī)模型,讓機(jī)器能夠?qū)τ脩舻谋磉_(dá)進(jìn)行深度分析、聯(lián)想,寫出堪比人類詩(shī)人的規(guī)整詩(shī)句。吳華在現(xiàn)場(chǎng)展示了兩首五言絕句,現(xiàn)場(chǎng)觀眾也難以區(qū)分哪一首由機(jī)器創(chuàng)作。據(jù)悉,近日上市的李彥宏新書《智能革命》就刊登了一篇由百度人工智能“親自創(chuàng)作”的序言。
如今,“大數(shù)據(jù)+計(jì)算能力”正在讓技術(shù)走上高速發(fā)展的快車道,在不久的未來(lái),人工智能技術(shù)將像新電力一樣,逐漸改變?nèi)藗兊纳?。吳華指出,知識(shí)與記憶、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)的深度結(jié)合將改變?nèi)伺c機(jī)器的交互方式,讓人們盡享技術(shù)創(chuàng)新福利的同時(shí),也促進(jìn)人工智能產(chǎn)業(yè)的創(chuàng)新。
官方微博
官方微信公眾號(hào)
官方百家號(hào)