【AI世代編者按】百度首席科學(xué)家吳恩達(dá)近日接受科技博客GigaOM采訪時(shí)表示,創(chuàng)造力并非深不可測,人工智能不僅可以獲得創(chuàng)造力,甚至有可能具備意識。
以下為原文內(nèi)容:
吳恩達(dá)2014年5月出任百度首席科學(xué)家。他負(fù)責(zé)領(lǐng)導(dǎo)該公司的全球人工智能戰(zhàn)略和基礎(chǔ)設(shè)施建設(shè)。他領(lǐng)導(dǎo)百度北京研究院和百度硅谷研究院,帶領(lǐng)技術(shù)團(tuán)隊(duì)在語音、大數(shù)據(jù)和圖片搜索領(lǐng)域開展研發(fā)工作。
除了任職于百度外,吳恩達(dá)還是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的兼職教授。2011年,他領(lǐng)導(dǎo)開發(fā)了斯坦福的MOOC(大規(guī)模開放在線課程)平臺,并教授了一門在線機(jī)器學(xué)習(xí)課程,聽課學(xué)生已經(jīng)超過10萬。他后來參與創(chuàng)辦了Coursera,至今仍然擔(dān)任董事長。
在此之前,吳恩達(dá)還是谷歌大腦深度學(xué)習(xí)項(xiàng)目的創(chuàng)始負(fù)責(zé)人。他署名和聯(lián)合署名的機(jī)器學(xué)習(xí)、機(jī)器人及相關(guān)領(lǐng)域論文超過100篇。他2013年入選《時(shí)代周刊》評選的“全世界有影響力的100人”。他先后在卡內(nèi)基梅隆大學(xué)、麻省理工學(xué)院和加州大學(xué)伯克利分校獲得學(xué)位。
他將于2月15日至16日在舊金山舉行的Gigaom AI大會上發(fā)表演講,以下是我們對他的采訪。
問:請給我們講講你在百度的日常工作。你的人工智能團(tuán)隊(duì)都做些什么?
答:我們會開發(fā)基礎(chǔ)的人工智能技術(shù),從語音識別到計(jì)算機(jī)視覺,從神經(jīng)語言程序?qū)W到數(shù)據(jù)倉庫,再到用戶理解。我們會利用這些技術(shù)支持百度的很多內(nèi)部業(yè)務(wù),還會孕育新的方向。例如,在百度內(nèi)部,我們所有的重要業(yè)務(wù)領(lǐng)域都已經(jīng)被人工智能改變。從網(wǎng)絡(luò)搜索和廣告投放到機(jī)器翻譯和餐廳推薦。所以人工智能已經(jīng)在百度隨處可見。
除此之外,我們還看到了很多由人工智能創(chuàng)造的新機(jī)會,例如更好的對話式醫(yī)療助手——它采用聊天盒子的形式。我們還使用面部識別開發(fā)了十字轉(zhuǎn)門,可以在有權(quán)限的人接近時(shí)自動(dòng)打開。所以說,我們的團(tuán)隊(duì)正在追求垂直領(lǐng)域的各種新機(jī)會。
問:你做的事情有沒有涉及基礎(chǔ)研究的內(nèi)容?你有沒有做過一些或許有用,但還不知道具體如何使用的事情?
答:我們會從事很多基礎(chǔ)研究。有些研究初是一項(xiàng)非常成功的基礎(chǔ)研究,經(jīng)過一段時(shí)間之后,當(dāng)你從中看到實(shí)用價(jià)值后,它就沒有那么基礎(chǔ)了。我們有很多這樣的研究。我們在百度開展的早期面部識別工作初就像是基礎(chǔ)研究,但現(xiàn)在已經(jīng)成為融入產(chǎn)品的一項(xiàng)服務(wù),供數(shù)以億計(jì)的用戶使用。
我們早期在神經(jīng)機(jī)器翻譯領(lǐng)域的工作初也是基礎(chǔ)研究。事實(shí)上,此事包含著鮮為人知的一面:神經(jīng)機(jī)器翻譯是一項(xiàng)早由中國開拓、發(fā)展和推出的技術(shù)。美國公司在這方面遠(yuǎn)遠(yuǎn)落后于百度,這個(gè)例子可以說明我們的中國團(tuán)隊(duì)處于領(lǐng)先地位。
我感覺我們在面部識別領(lǐng)域展開的計(jì)算機(jī)視覺基礎(chǔ)研究同樣處于先驅(qū)地位。我們目前正在學(xué)習(xí)機(jī)器人和機(jī)器學(xué)習(xí)等領(lǐng)域展開廣泛的基礎(chǔ)研究,涵蓋從基礎(chǔ)研究到應(yīng)用的整個(gè)過程。
問:百度的團(tuán)隊(duì)是什么樣子?你們是否普遍采用小團(tuán)隊(duì)形式?是否以開發(fā)人員為主?你們認(rèn)為怎樣才能有效分配有限的資源?
答:這是個(gè)復(fù)雜的問題。我們的很多項(xiàng)目一開始都很小。比如一年前,自動(dòng)駕駛團(tuán)隊(duì)只有22人。但在取得一些進(jìn)展,展示出初的前景,并制定了經(jīng)過深思熟慮的商業(yè)計(jì)劃后,便可因此投入更多資源,現(xiàn)在的團(tuán)隊(duì)可能已經(jīng)有幾百人了。這一開始是一個(gè)基礎(chǔ)研究項(xiàng)目,但現(xiàn)在成為了全新的業(yè)務(wù)方向。
所以我們有很多項(xiàng)目初的團(tuán)隊(duì)規(guī)模都很小,但在取得一些進(jìn)展,價(jià)值越發(fā)明確后,便會將團(tuán)隊(duì)規(guī)模擴(kuò)大到幾十人,甚至幾百人。
問:你認(rèn)為當(dāng)今人工智能技術(shù)有哪些難題可以在5年內(nèi)解決? 有哪些事情如今看來很難實(shí)現(xiàn),但5年后會變得稀松平常?
答:從研究角度來看,我認(rèn)為遷移學(xué)習(xí)和多任務(wù)學(xué)習(xí)是我需要探索的領(lǐng)域之一。當(dāng)今機(jī)器學(xué)習(xí)技術(shù)的多數(shù)經(jīng)濟(jì)價(jià)值都是應(yīng)用學(xué)習(xí),學(xué)習(xí)許多標(biāo)簽化的數(shù)據(jù),以此完成你希望解決的具體任務(wù)。例如,利用龐大的標(biāo)簽化人臉數(shù)據(jù)庫學(xué)習(xí)識別人臉。對于很多任務(wù)而言,我們在特定的垂直領(lǐng)域根本沒有足夠的數(shù)據(jù)來構(gòu)建自己的系統(tǒng)。
所以今后的一大領(lǐng)域是遷移學(xué)習(xí),你可以讓一套機(jī)器學(xué)習(xí)系統(tǒng)從事不同的任務(wù)。比如讓它學(xué)會識別常見物體。學(xué)會了識別常見物體后,可以利用其中的多少知識來從事面部識別這項(xiàng)具體任務(wù)?
從研究角度來看,我認(rèn)為這很有前景,而且有一些技術(shù)目前已經(jīng)廣泛應(yīng)用于遷移學(xué)習(xí),但我認(rèn)為相關(guān)的理論和佳實(shí)踐仍然處于早期階段。我們之所以看好遷移學(xué)習(xí),是因?yàn)楝F(xiàn)代深度學(xué)習(xí)技術(shù)已經(jīng)可以為具備海量數(shù)據(jù)的問題提供不可思議的價(jià)值。這可以為很多應(yīng)用模式的發(fā)展提供巨大的動(dòng)力。
以語音識別為例。我們在某些語言上擁有海量數(shù)據(jù),比如普通話。某些語言的使用人數(shù)很少,永遠(yuǎn)不可能有這么龐大的數(shù)據(jù)。因此,可以將我們從普通話學(xué)到的知識遷移到這種語言,從而則針對只有少數(shù)人使用、數(shù)據(jù)量很小的中國方言提供語音識別。我們的確有這方面的技術(shù),我們目前也在從事這方面的開發(fā),但我認(rèn)為這一研究領(lǐng)域的進(jìn)步可以幫助人工智能解決更多問題。
問:人工智能是否為我們提供了有用的信息,幫助我們了解人類智能?或者反過來,我們是否利用對人類智能的了解改進(jìn)人工智能的效果?又或者它們雖然都有“智能”這個(gè)詞,但實(shí)際上卻截然不同?
答:神經(jīng)科學(xué)領(lǐng)域的知識對近的人工智能發(fā)展只起到了一點(diǎn)作用。從現(xiàn)實(shí)角度看,盡管神經(jīng)科學(xué)經(jīng)過了幾個(gè)世紀(jì)的發(fā)展,但我認(rèn)為我們至今對人類大腦的工作方式仍然很不了解,所以我們對人類大腦工作方式的了解并沒有給人工智能帶來太多啟發(fā)。但實(shí)際上,人工智能技術(shù)當(dāng)前的進(jìn)步更大程度上源于計(jì)算機(jī)科學(xué)原理,而非神經(jīng)科學(xué)原理。
盡管如此,人工智能已經(jīng)非常擅長自動(dòng)處理人類所能從事的事情。例如人類非常擅長識別語音,而人工智能語音識別也在從事相同的任務(wù)。人類非常擅長識別人臉,人工智能也在這一領(lǐng)域取得了快速進(jìn)步。
結(jié)果就是,我們的工具更擅長自動(dòng)處理人類所能完成的工作,而不是解決人類都無法勝任的任務(wù)。原因有很多,但其中之一在于,當(dāng)我們選擇一項(xiàng)人類能夠完成的任務(wù),然后讓人工智能介入其中之后,就會努力研究為什么人類完成任務(wù)的速度更快。所以,如果你看看人工智能的各種垂直領(lǐng)域,肯定會發(fā)現(xiàn)一些連人類都不太擅長的任務(wù)。
我認(rèn)為亞馬遜現(xiàn)在為我推薦的書甚至比我妻子推薦的還好。要知道,我妻子對我非常了解。之所以出現(xiàn)這種情況,是因?yàn)閬嗰R遜匯總了海量數(shù)據(jù),了解我瀏覽過哪些書,在網(wǎng)站上看過哪些書。從這個(gè)角度看,它遠(yuǎn)比我的妻子更了解我在看什么內(nèi)容。
雖然也有一些例外,但當(dāng)人工智能試圖處理人類力所能及的事情時(shí),我認(rèn)為整體的進(jìn)步速度很快。
問:談到人工智能所能完成的任務(wù),你總是顯得很保守。我猜之所以這樣,部分原因在于過高的預(yù)期曾經(jīng)對科研工作產(chǎn)生過極大的影響,尤其是在資金方面。是這樣嗎?
答:我通常很務(wù)實(shí),也很實(shí)際。但我希望提供一個(gè)略有不同的視角。如果我要組建一個(gè)團(tuán)隊(duì)來治愈人類所有的疾病,那肯定值得慶祝。這是個(gè)偉大的任務(wù)。但說實(shí)話,有時(shí)候把目標(biāo)定得太高會付出代價(jià)。在當(dāng)今的硅谷,這顯然不受歡迎,而且逆勢而為。硅谷現(xiàn)在都喜歡談?wù)摰窃履欠N級別的目標(biāo),因?yàn)榧幢隳闶×?,仍然會成為明星?/span>
但實(shí)際上,我認(rèn)為把目標(biāo)定得太高會付出代價(jià)。所以,跟組建團(tuán)隊(duì)來治愈人類所有的疾病相比,更有成效、對世界更有利的做法或許是解決瘧疾問題。所以我認(rèn)為,我們可以通過人工智能技術(shù)給世界帶來一些重大改變??梢杂脽o人駕駛汽車改變交通狀況,也可以利用人工智能技術(shù)改變物流行業(yè),甚至可以用人工智能技術(shù)徹底改變醫(yī)療技術(shù)。可以借助人工智能技術(shù)給世界帶來重大變革。
因此,我的很多工作都瞄準(zhǔn)了這些具體而務(wù)實(shí)的目標(biāo),因?yàn)槲艺J(rèn)為,相比于花時(shí)間描繪科幻小說那種幾百年可能都無法實(shí)現(xiàn)的場景,這樣做對世界更為有利。我知道這種思維方式在硅谷已經(jīng)不再流行,甚至逆勢而為。
盡管如此,作為一個(gè)社會,我們應(yīng)該從事各種各樣的事情。所以我認(rèn)為世界會變得更好,有的人會通過蓋茨基金會和世界衛(wèi)生組織解決瘧疾問題,我們在對抗瘧疾的過程中或許已經(jīng)取得了實(shí)質(zhì)性進(jìn)展。但同時(shí)也有一些人在解決人類的所有疾病。以不同方式分配社會資源是件好事。
但我的確認(rèn)為,如果能夠思考“我們有信心解決哪些任務(wù)?”而不是“我們應(yīng)該投資哪些遙不可及的夢想?”肯定有助于我們所在的領(lǐng)域取得進(jìn)步。我們團(tuán)隊(duì)有一部分人在從事這些工作,但僅占很小一部分。
問:你相信有可能實(shí)現(xiàn)強(qiáng)人工智能(AGI)嗎?如果相信,你認(rèn)為這有可能借助摩爾定律,在我們所知的技術(shù)革命道路上實(shí)現(xiàn)嗎?或者,要實(shí)現(xiàn)強(qiáng)人工智能,是否需要借助全新的突破,甚至我們不曾預(yù)料的突破?
答:要實(shí)現(xiàn)強(qiáng)人工智能肯定需要很多突破。這很可能發(fā)生。既包括軟件算法突破,也有可能包括硬件突破。但究竟是在十年、百年還是千年以后實(shí)現(xiàn),我很難預(yù)測。
問:你認(rèn)為人類的創(chuàng)造力(例如創(chuàng)作劇本或偉大的小說)需要借助強(qiáng)人工智能技術(shù),還是利用現(xiàn)有的技術(shù)即可完成?
答:我認(rèn)為很多時(shí)候,當(dāng)我們不知道某個(gè)東西的創(chuàng)造流程時(shí),會思考很多創(chuàng)造力方面的東西。例如,加里·卡斯帕羅夫(Garry Kasparov)曾經(jīng)說過,他從深藍(lán)的招數(shù)中看到了創(chuàng)造力。而作為技術(shù)人員,我了解國際象棋程序的運(yùn)行規(guī)則。通過海量計(jì)算,它們使出的國際象棋招數(shù)甚至能被象棋大師視作創(chuàng)造力。
當(dāng)我自己參與到創(chuàng)造流程之后,我發(fā)現(xiàn)創(chuàng)造力是很困難的事情,需要將很多小東西逐漸拼湊起來,然后形成一個(gè)似乎不知來自何處的大東西。但如果有人沒有看到所有的小東西,那就很難將所有小東西拼湊成有創(chuàng)意的東西。有的時(shí)候,與從內(nèi)部觀察相比,從外部觀察創(chuàng)造力會感覺這更像是一種魔術(shù)。
我的藝術(shù)家朋友會反復(fù)訓(xùn)練自己的筆觸,一遍一遍不厭其煩地繪制相同的東西,逐漸取得進(jìn)步。我的祖父是一名畫家,他通過日積月累的進(jìn)步創(chuàng)造出優(yōu)異的作品,當(dāng)你見到終的作品而沒有目睹整個(gè)過程的點(diǎn)滴進(jìn)步時(shí),我認(rèn)為你更會感覺這像是一場魔術(shù)。但如果你本人需要從事各種工作來實(shí)現(xiàn)這個(gè)點(diǎn)滴進(jìn)步的過程,恐怕就不會有這么強(qiáng)烈的沖擊。
問:你的言外之意是說,人類的創(chuàng)造力是可以通過計(jì)算獲得的。在某個(gè)時(shí)間范圍內(nèi)是合理的。這并不是什么超凡脫俗的神秘能力,并沒有超越我們的認(rèn)知。是這樣嗎?
答:沒錯(cuò)。無論是偶爾令人眼前一亮的象棋妙招,還是找到一句人類未曾思考過的句子解釋,抑或創(chuàng)造一件簡單的藝術(shù)品,我認(rèn)為機(jī)器的行為在某些人的眼中已經(jīng)具備了一定的創(chuàng)造力。我們可能會繼續(xù)看到點(diǎn)滴的進(jìn)步,而機(jī)器終也將在未來幾年更具“創(chuàng)造力”。
問:你的團(tuán)隊(duì)在地理上是如何分布的?多數(shù)人都在哪里?
答:主要在北京,我們在美國大約有一個(gè)100人的團(tuán)隊(duì),北京有幾個(gè)大型團(tuán)隊(duì),在上海和深圳還有幾個(gè)小團(tuán)隊(duì)。
問:有了機(jī)器人,你可以看到國家和地區(qū)的重點(diǎn)開始浮現(xiàn)。例如,與其他地方相比,日本更重視提升機(jī)器人的友好度,讓人類可以與之建立情感聯(lián)系。人工智能領(lǐng)域是否也是這種情況?因?yàn)槟阒疤岬矫娌孔R別已經(jīng)進(jìn)入中國。不同公司、不同地區(qū)或不同國家對于人工智能的看法是否會有差異?
答:我認(rèn)為面部識別就很好地證明經(jīng)濟(jì)壓力和一流的商業(yè)模式已經(jīng)推動(dòng)中國實(shí)現(xiàn)了很大進(jìn)步.。從產(chǎn)品角度來看,不同的商業(yè)壓力和產(chǎn)品優(yōu)先級導(dǎo)致不同國家對不同領(lǐng)域的投資力度有所差異。
中國就有一些現(xiàn)成的例子:在中國,通過手機(jī)鍵盤輸入中文比輸入英文更痛苦。由此便產(chǎn)生了很多壓力,催生了更好的手機(jī)語音識別技術(shù)。所以我感覺,百度引領(lǐng)的很多語音識別突破都源自產(chǎn)品壓力,必須為用戶提供有效的語音識別功能。
具體到機(jī)器翻譯,美國針對神經(jīng)機(jī)器翻譯展開了很多公關(guān)工作。但鮮為人知的是,神經(jīng)機(jī)器翻譯是由中國率先開拓、發(fā)展和推出的。美國大型公司后來才開始發(fā)展這項(xiàng)技術(shù)。我認(rèn)為,之所以出現(xiàn)這種現(xiàn)象,原因之一在于中國人很需要把公開內(nèi)容翻譯成中文。而英文世界里已經(jīng)有很多英文內(nèi)容。中文內(nèi)容同樣很多,但外國內(nèi)容也在快速翻譯成中文。這就像一種文化現(xiàn)象。由于世界上有很多英文內(nèi)容,我認(rèn)為說英語的人接觸外語內(nèi)容的壓力較小。
面部識別業(yè)務(wù)在中國進(jìn)展飛快,因?yàn)樽鳛橐粋€(gè)優(yōu)先使用移動(dòng)設(shè)備的社會,中國人已經(jīng)習(xí)慣了開展重大的財(cái)務(wù)交易。例如,你可以向百度申請教育貸款,我們就會根據(jù)你在手機(jī)上的行為貸給你很多錢。而當(dāng)我們通過手機(jī)給某人匯去很多錢時(shí),就很希望能驗(yàn)證此人的身份。所以面部識別就成為這一領(lǐng)域的關(guān)鍵技術(shù)。正是因?yàn)槊鎸@些壓力,才使得面部識別在中國實(shí)現(xiàn)了快速發(fā)展,速度超過其他國家。
中國和美國都在人工智能領(lǐng)域展開了很多創(chuàng)新。我猜還有其他領(lǐng)域。英國在人工智能游戲領(lǐng)域進(jìn)行大舉投資,我本人并沒有投入這一領(lǐng)域的研究,但我估計(jì)不同組織有著不同的興趣和重點(diǎn)。
我認(rèn)為當(dāng)今的人工智能發(fā)展已經(jīng)成為一個(gè)全球化的現(xiàn)象。我感覺中國還有很多創(chuàng)新是英語世界的人沒有意識到的。問題不在于保密與否,關(guān)鍵是缺乏流暢的交流能力。例如,我?guī)字芮皠倓倕⒓恿薔IPS大會。短短一天內(nèi),NIPS上的多數(shù)重要講話都已經(jīng)總結(jié)和記錄成中文,并發(fā)表在中國的網(wǎng)站上。也就是說,把巴塞羅那的英語會議上的知識翻譯成中文的速度很快,效率很高。這樣一來,很多中國研究人員一天之內(nèi)就能看到這些內(nèi)容的中文翻譯。我認(rèn)為,正是因?yàn)楹芏嘀袊硕寄苡糜⒄Z流利地閱讀和講話,才使之成為可能。
可惜的是,把中文翻譯成其他內(nèi)容的速度卻慢得多,這完全是因?yàn)橹袊獾暮芏嘌芯咳藛T都不說中文。所以雖然中國發(fā)明了很多東西,也有很多東西廣為流傳,但英文世界的人卻并沒有注意到。有的時(shí)候,英語世界的公司可能要到一年以后才能發(fā)明類似的東西。
因此,我希望能夠幫助人們加快知識的反向傳播速度。因?yàn)?,如果我們建立一個(gè)更加國際化的研究社區(qū),全世界都將取得更快的進(jìn)步速度。
我覺得還有一些更具體的例子。一年多以前,普通話短語的語音識別率已經(jīng)超過人類,但這個(gè)結(jié)果直到近才在全球廣為人知。我還見過很多例子,從語音識別進(jìn)步到神經(jīng)機(jī)器翻譯進(jìn)步,再到GPU開發(fā)流程的進(jìn)步。但我希望在中國發(fā)明出來之后,能夠盡快傳播到美國。
問:你能否介紹一些網(wǎng)站或期刊,方便我們找到這些信息?
答:中文的知識傳播方式與美國不同。人工智能知識在中國社交媒體上傳播速度極快,如果你不親身體驗(yàn),就很難理解這種模式。此外還有很多網(wǎng)站,但很多都是中文網(wǎng)站。你可以在Twitter上關(guān)注我,看看我能做點(diǎn)什么。
問:你對人類意識有什么看法?或者更具體地說,你是否相信人類的意識本質(zhì)上也是一種計(jì)算?
答:我不知道意識是什么。從哲學(xué)上講,關(guān)于你周圍的人是真的有意識,還是行尸走肉,抑或是通過計(jì)算表現(xiàn)出意識的機(jī)器人,一直都有爭論。畢竟,我們?nèi)绾沃雷约褐獾钠渌苏娴挠幸庾R,而不是機(jī)器人?我不認(rèn)為意識是計(jì)算機(jī)永遠(yuǎn)無法達(dá)到的,但目前還不清楚究竟如何實(shí)現(xiàn),需要多少年才能實(shí)現(xiàn)。(編譯/長歌)
官方微博
官方微信公眾號
官方百家號