3月30日,百度發(fā)布了DuerOS智慧芯片,百度官方稱,這將“完善智能物聯(lián)網(wǎng)生態(tài),開啟‘可對話’智慧設(shè)備時代”。
發(fā)布會上,百度宣布與紫光展銳、ARM、上海漢楓達成戰(zhàn)略合作。具體講:百度的DuerOS智慧芯片與紫光展銳RDA5981集成,“低功耗、低成本”,提供豐富的IO接口,支持Wi-Fi/藍牙多種連接模式;同時,采用ARM公司mbed OS內(nèi)核及其安全網(wǎng)絡(luò)協(xié)議棧,實現(xiàn)云端連接,“降低了設(shè)備開放商應(yīng)用門檻”;在此基礎(chǔ)上,作為物聯(lián)網(wǎng)方案服務(wù)商的漢楓科技,則基于該芯片推出WiFi模組HF-LPB200U,集成了DuerOS智能語音交互功能,已經(jīng)處于量產(chǎn)階段。
這一招除了對做智能語音及相關(guān)產(chǎn)品的公司構(gòu)成威脅,百度讓“度秘大腦”成為智能時代無處不在的“大腦”的布局也全面鋪開。
吳恩達的離開并沒有讓中國的人工智能“冷”下來,不僅沒有冷,BAT 在這之后緊鑼密鼓的出招讓“AI三國殺”全面升級。在吳恩達宣布計劃離開百度的第二天,騰訊就高調(diào)迎來了張潼。很快,阿里云棲大會揭幕了阿里經(jīng)由云計算通往智能之路的一系列重大產(chǎn)品和布局。
昨天百度發(fā)布的這款DuerOS智慧芯片及合作計劃,將構(gòu)建包括度秘大腦、語音解決方案、芯片/模組在內(nèi)的三層結(jié)構(gòu)。其中,前兩層由百度度秘提供,芯片模組板塊則由紫光展銳、ARM、漢楓共同支持。
除了DuerOS智慧芯片,百度還將推出了DuerOS開放平臺,讓客戶可以在云端完成對DuerOS的個性化定制,同時提供設(shè)備與云端、APP端互聯(lián)的能力。
DuerOS是由度秘研發(fā)的對話式人工智能操作系統(tǒng),強調(diào)使用自然語言進行語音對話的交互方式,同時通過云端大腦時刻進行自動學(xué)習(xí)。DuerOS今年1月在拉斯維加斯CES大會上首次對外發(fā)布。當(dāng)時,百度度秘總經(jīng)理景鯤在CES現(xiàn)場接受了新智元的專訪,景鯤表示DuerOS是百度重點推出的戰(zhàn)略性產(chǎn)品,是“人工智能時代的操作系統(tǒng)”。
景鯤說:“我們一直在提一個新的概念,叫Conversational Computer(對話式計算機)。我認(rèn)為的趨勢是將來人們會越來越多地跟設(shè)備對話,而且我們從百度搜索、百度語音搜索上已經(jīng)看到了這樣的趨勢,用戶會越來越接受跟設(shè)備進行對話,用自然語言的方式進行交流。用戶獲取信息服務(wù)的門檻在降低,我們希望將來的入口是無處不在的,用戶在有需要的時候就跟設(shè)備進行對話。這次我們重點推出的戰(zhàn)略性產(chǎn)品就是——DuerOS,我們把它叫做 Conversational AI OS(對話式的人工智能操作系統(tǒng))?!?/span>
有話說得好,“得操作系統(tǒng)者得天下”,在各家都號稱要做萬物智能、萬物互聯(lián)的現(xiàn)在,連接上下游的操作系統(tǒng)才是真正的核心。從第一代的Wintel、第二代iOS和安卓,到如今的第三代人工智能操作系統(tǒng),這無疑是一個巨大的機會,從中完全可能誕生世界級的公司。
百度的DuerOS定位于嵌入式操作系統(tǒng),雖然并不構(gòu)成“中央集權(quán)”,但無疑將自己融入了更廣泛的場景之中。而為了應(yīng)對這些不同場景里的交互,百度將賭注押在了對話式OS上面。雖有亞馬遜 Alexa/Echo 的光輝例子,但還是有很多人不看好語音交互,認(rèn)為語音是一個“偽入口”。但百度顯然不這樣認(rèn)為,同時百度在開拓生態(tài)方面也全力以赴。在DuerOS智慧芯片發(fā)布現(xiàn)場,百度公司首席架構(gòu)師、度秘事業(yè)部首席技術(shù)官朱凱華說,“我們永遠免費授權(quán)”,“百度在這里不是希望賺錢,我們也不是為了商業(yè)化而開始,是希望能夠和所有的合作伙伴一起把這個事情做大”。
3月27日,2017新智元開源·生態(tài)AI技術(shù)峰會上,百度度秘事業(yè)部總經(jīng)理景鯤發(fā)表了演講《對話式人工智能的應(yīng)用與未來》。景鯤不僅全面解讀百度對話式的人工智能操作系統(tǒng) DuerOS,還坦承分享了很多經(jīng)驗教訓(xùn),以及百度在人工智能方面的儲備和戰(zhàn)略。
抓住了產(chǎn)業(yè)鏈上的核心環(huán)節(jié),All in 對話式人工智能操作系統(tǒng),能讓百度成為世界級企業(yè)嗎?
百度 All in AI:定戰(zhàn)略、聚人才、儲技術(shù)、找場景
演講內(nèi)容很多,在這里首先提煉一些重點金句:
1. 我們看一個公司在人工智能上是否真的投入,應(yīng)該看組織架構(gòu),組織架構(gòu)是影響人工智能執(zhí)行效率的。如果是一家大公司,一定要判斷它是不是把人工智能作為一項業(yè)務(wù)來發(fā)展。只有作為一項業(yè)務(wù)發(fā)展,而且是一個獨立事業(yè)部時,組織效率才會高。
2. 人工智能人才現(xiàn)在非常昂貴,同時現(xiàn)在的人才也不是很多。我們需要抓住top的人才,這些人主要分布在中國和美國。從百度的角度,人工智能相對top的人才都已經(jīng)聚集在百度,從中國到美國。
3. 除了懂算法、懂?dāng)?shù)據(jù),會機器學(xué)習(xí)的頂尖人才,還有一種人才非常稀缺,就是AI的產(chǎn)品經(jīng)理。
4. 我們?nèi)绻胍腥胍粋€好的場景,要儲備很長時間才能把這個場景搶過來。這是培育期,就是獲得足夠的數(shù)據(jù),讓系統(tǒng)足夠聰明。
5. 把一個通用對話能力放到一個小場景里能解決什么問題?能做到什么效果?做通用的人工智能太難了,但如果放到一個具體的場景里就很簡單。
6. 在對話式人工智能推進的過程中關(guān)鍵的是端到端的用戶需求滿足。很多人并不需要語音識別,他們需要端到端的需求滿足,比如是否能夠播音樂,查天氣,查股票價格,這才是用戶真正關(guān)心的。
以下為度秘事業(yè)部總經(jīng)理景鯤的演講。
景鯤:我會在分享中介紹我們在研發(fā)過程中遇到了什么困難,如何一步步走到未來。同時,也與大家交流一下我們的儲備和戰(zhàn)略。
大家可能看過這個叫《HER》的電影,“Her”是一個人工智能,主人公通過一個耳機和一個手機,就能跟Her進行溝通。我今天演講的主題是“對話式人工智能”。如何定義對話式人工智能?在很多科幻片里我們會看到這樣一些對話式人工智能,有時候是機器人,有時候是計算機、耳機,甚至是無處不在的虛擬物質(zhì)。這是老百姓心目當(dāng)中的對話式人工智能,我們的愿景也正是研發(fā)出這樣的對話式人工智能。
第三代人工智能操作系統(tǒng),百度的賭注是對話式 AI
那么,我們距離愿景是不是已經(jīng)很近了?
以前,我們學(xué)習(xí)計算機語言,學(xué)習(xí)拼音、五筆,那時我們以機器的語言與計算機交流?,F(xiàn)在,我們用語音的方式與計算機交互,計算機解決的問題就是讓機器學(xué)會人的語言,讓機器用人的語言與人溝通。對話式人工智能就是希望讓機器學(xué)會人的語言,用自然的方式與人進行溝通。
我們看整個科技的發(fā)展,每一個時代,從PC時代到無線時代到AI時代,人類都在用不同的方式與機器進行溝通。例如第一代我們用鼠標(biāo)、鍵盤產(chǎn)生的機器語言與計算機進行溝通,代表的操作系統(tǒng)是 Windows;第二代我們用手指與機器進行互動,代表的操作系統(tǒng)是iOS和安卓;第三代是人工智能操作系統(tǒng),我們希望用戶以對話的方式與設(shè)備進行溝通。
每一代操作系統(tǒng)都是用戶交互方式的變革,它們都有趨同性,也即交互方式變得越來越自然,從原來的機器語言到半機器語言,后到機器學(xué)人的語言,使用的門檻越來越低。
我們希望降低第三代系統(tǒng)的門檻。百度的使命是讓人平等便捷地獲取信息,找到所求。什么是平等?平等就是讓每個人用自然的方式,隨時隨地能夠獲得信息,找到所求。
百度人的看法:推進 AI 有 4+1 件事情一定要做對,若不提出來很多人可能會忽略
為什么我們要做對話式人工智能?這里有數(shù)據(jù)可以跟大家分享一下。大家如果打開今天的手機百度,在手機百度下面我們放了一個很長的大按鈕,可以按著說話。我們發(fā)現(xiàn)人類運用自然語言跟設(shè)備進行溝通的需求越來越強,過去一年百度語音的日活增長率為100%,而且這種增長已經(jīng)持續(xù)幾年。
事實證明,用戶已經(jīng)可以用語音與設(shè)備進行對話,這個浪潮正在到來。那么,對話式人工智能如何來落地?下面我想分享一些看法。
若想真正推進人工智能,有幾件事情一定要做對,而且這些事情如果不提出來可能很多人會忽略。今天在座的有創(chuàng)業(yè)者,有大公司,也有很多投資人。從我們百度人的角度來看,有哪幾件事情才能推進人工智能落地呢?
一是定戰(zhàn)略。這個事情很容易被忽略,我們看一個公司在人工智能上是否真的投入,應(yīng)該看組織架構(gòu),組織架構(gòu)是影響人工智能執(zhí)行效率的。你看百度的組織架構(gòu),再看其他人工智能公司的組織架構(gòu)。如果是一家創(chuàng)業(yè)公司,創(chuàng)業(yè)公司的組織架構(gòu)很清晰,all in AI;如果是一家大公司,一定要判斷它是不是把人工智能作為一項業(yè)務(wù)來發(fā)展。只有作為一項業(yè)務(wù)發(fā)展,而且是一個獨立事業(yè)部時,組織效率才會高。隨著陸奇加入百度,我們成立了獨立的度秘事業(yè)部來開展人工智能。
二是聚人才。人工智能人才現(xiàn)在非常昂貴,同時現(xiàn)在的人才也不是很多。我們需要抓住top的人才,這些人主要分布在中國和美國。從百度的角度,人工智能相對top的人才都已經(jīng)聚集在百度,從中國到美國。除了懂算法、懂?dāng)?shù)據(jù),會機器學(xué)習(xí)的頂尖人才,還有一種人才非常稀缺,就是AI的產(chǎn)品經(jīng)理,我覺得這種人才必須要有分裂式人格。一方面他非常堅信未來就是這樣;另一方面他一定知道現(xiàn)在落地有多困難,AI的落地多困難,AI的現(xiàn)狀與用戶的期望差異有多大。只有這種對愿景滿懷期待且有技術(shù)能力的人才,才能推進AI的業(yè)務(wù)。
三是技術(shù)。其實AI相關(guān)技術(shù)真的沒那么容易。整個百度AI技術(shù)從基礎(chǔ)的機器學(xué)習(xí)的平臺到PaddlePaddle,到語音技術(shù),自然語言處理,圖像技術(shù),用戶畫像,每一項技術(shù)都需要儲備五六年以上,所以如果想把對話式人工智能做好,必須要把相關(guān)的技術(shù)儲備好。
例如我們的語音,在2016年麻省理工科技評論評出的10大突破型技術(shù)中排名第二,我們的OCR技術(shù)獲得了很多榮譽,我們的PaddlePaddle是國內(nèi)首個開源機器學(xué)習(xí)平臺,所以百度在技術(shù)方面儲備深厚。
四是找場景。這是關(guān)鍵的,很多企業(yè)都死在找場景,AI要做好一定要找一個能落地的場景。通用的對話式AI很難做,因此需要分場景突破。
好的場景有幾個特點:第一、它是要符合用戶交互習(xí)慣——如果用戶在這個場景上已經(jīng)養(yǎng)成鍵盤或觸摸式的交互習(xí)慣,其實很難改變用戶場景;第二、場景需要適合當(dāng)下技術(shù)的應(yīng)用,只有技術(shù)成熟,才能做出比較好的產(chǎn)品;第三、對話式人工智能要滿足用戶對話式的需求。
今年1月份,我們在美國拉斯維加斯正式推出了DuerOS對話式人工智能操作系統(tǒng)。對話式操作系統(tǒng)的演進是一個漫長的過程,需要儲備比較長的時間。我們大概在2014年7月份正式推出了對話式人工智能助理,到2015年首次發(fā)布,這是我定義的第一個時期,初創(chuàng)期。
其次,如果對話式人工智能團隊說想攻克難關(guān),都要要打一個問號,看這個團隊在這一領(lǐng)域是否有足夠的儲備。例如,我們?nèi)绻胍腥胍粋€好的場景,要儲備很長時間才能把這個場景搶過來。這是培育期,就是獲得足夠的數(shù)據(jù),讓系統(tǒng)足夠聰明。
原來在搜索上我們得到的絕大部分與關(guān)鍵詞有關(guān)的數(shù)據(jù),和平時溝通說話的數(shù)據(jù)不一樣,我們溝通的時候用的是口語交互。當(dāng)你加了語音搜索時,用戶會傾向用自然語言的方式與設(shè)備進行交互,這些都是以前搜索引擎沒有見到的數(shù)據(jù)。只有找到這些數(shù)據(jù),把機器大腦培育好之后,才進入第三個階段——在一個場景里加速突破。
所以,DuerOS戰(zhàn)略的過程很簡單,當(dāng)我們的能力足夠強大之后,要分場景突破,把能力和具體設(shè)備、場景相結(jié)合,賦予這些設(shè)備和場景以能力。很多設(shè)備和場景已經(jīng)有對話式需求,只是我們之前沒有想到。我舉個具體例子。我們近做了很多的活動,發(fā)布了很多產(chǎn)品。我爸眼睛不太好,說你做了這么多設(shè)備和產(chǎn)品,為什么不做空調(diào)?空調(diào)可以語音交互多好。他給我講了具體需求,他每次出差去賓館,由于眼花根本看不清楚空調(diào)上冷熱除塵這些小的圖標(biāo),所以每次都打電話讓服務(wù)員來調(diào)整。這就是場景里面用戶的實際需求。所以每一個小場景,每一個設(shè)備都有對話式需求,把這個對話式需求找出來就能解決用戶的痛點。
如果我們把一個通用對話能力放到一個小場景里能解決什么問題?能做到什么效果?剛才我已經(jīng)說過,做通用的人工智能太難了,但如果放到一個具體的場景里就很簡單。這是用對話的方式找飯店,是我們一年前做到的效果。
還有一個觀點是,在對話式人工智能推進的過程中技術(shù)是基礎(chǔ),關(guān)鍵的是端到端的用戶需求滿足。很多人并不需要語音識別,他們需要端到端的需求滿足,比如是否能夠播音樂,查天氣,查股票價格,這才是用戶真正關(guān)心的。所以,就對話式人工智能產(chǎn)品而言,功能性、性能、體驗都是用戶端到端一體的需求。
就百度而言,我們也希望把這種優(yōu)勢提供給合作伙伴,把我們豐富的信息和服務(wù)生態(tài)開放給合作伙伴,讓所有人都在這一基礎(chǔ)之上做比較好的、通用的、場景化的對話式人工智能。百度本來就是以搜索起家的公司,我們在信息生態(tài),服務(wù)生態(tài)方面的能力很強。這些能力都會分場景地提供給不同設(shè)備。同時,海量的數(shù)據(jù)非常重要,用戶要的是端到端的滿足。百度對數(shù)據(jù)的整合能力,接下來也會開放提供給所有的合作伙伴。
后一點是用戶認(rèn)知,什么時候讓老百姓覺得這個產(chǎn)品好用,甚至沒有把它當(dāng)成一個人工智能產(chǎn)品,我們才算是真正跨過了這個坎。希望大家能夠一起推動市場,推動 to C端,讓用戶認(rèn)知到人工智能產(chǎn)品的體驗很好。不同的合作伙伴,比如芯片和模組方、開發(fā)者、企業(yè)應(yīng)用,內(nèi)容資源方等,都要一起推動產(chǎn)業(yè)的發(fā)展。
3月30日,我們會與ARM和RDA一起發(fā)布DuerOS智能芯片,我們會把基礎(chǔ)的語音能力集成到很多設(shè)備里面,搭建一個平臺讓合作伙伴在這上面做相應(yīng)的對話式人工智能工作。同樣,我們也希望能賦予更多合作伙伴更多的可能。
總結(jié)而言,對話式人工智能的挑戰(zhàn)非常大,除了技術(shù)、數(shù)據(jù)、人才之外,是否能夠推動用戶的認(rèn)知也非常重要。在這個過程中,我們愿意分享所有的經(jīng)驗給大家,也希望把百度的能力開放給大家,讓大家把對話式人工智能做得更好。
我們會對產(chǎn)品進行全免費授權(quán),大家可以免費地用百度的能力,我們會提供端到端的滿足能力,大家可以直接拿到百度所有的信息和服務(wù)內(nèi)容。我們也會提供商業(yè)化變現(xiàn)的方式。我們會將第三代操作系統(tǒng)推薦給大家,以推動對話式人工智能的發(fā)展。
今天很高興跟大家分享,謝謝!
官方微博
官方微信公眾號
官方百家號