“2020年,全球?qū)a(chǎn)生10倍于現(xiàn)在的海量數(shù)據(jù)。今天所有的硬盤加起來也裝不下這些數(shù) 據(jù)?!?9日,中國互聯(lián)網(wǎng)協(xié)會、中國新聞社主辦的2015產(chǎn)業(yè)互聯(lián)網(wǎng)大會在浙江舉行,百度開放云總經(jīng)理劉煬在由國內(nèi)領(lǐng)先的IT基礎(chǔ)架構(gòu)供應(yīng)商——杭州華三 通信技術(shù)有限公司發(fā)起的“云計算與大數(shù)據(jù)”分論壇上說。
中國互聯(lián)網(wǎng)民數(shù)已經(jīng)達到了全球第一。2014年,中國互聯(lián)網(wǎng)人口達到了6.5億,普及率達到47.9%?!拔覀?nèi)硕?,不足為奇,但我們的普及率超過 了世界的平均水平,這說明中國人真的需要互聯(lián)網(wǎng)?!敝袊ヂ?lián)網(wǎng)協(xié)會創(chuàng)會理事長、原中國科學(xué)院副院長胡啟恒說,她給出了一種猜測,未來十年,中國網(wǎng)民人數(shù)將 突破10個億。
如此背景之下,大數(shù)據(jù)時代已經(jīng)來臨。目前,百度開放云已正式開放,這是一個公有云的服務(wù)。目前,開放的產(chǎn)品有計算(云服務(wù)器、負(fù)載均衡)、存儲(云盤、對象存儲、關(guān)系型數(shù)據(jù)庫、簡單緩存服務(wù))、分布式計算、安全以及其他服務(wù)等。
“這只是第一步,今天開放的服務(wù)大部分是百度三層大數(shù)據(jù)引擎中下面的一層,未來會有越來越多服務(wù)在百度云上進行開放?!眲f,隨著百度云開放,會幫助大家降低成本,加速創(chuàng)新。
越來越多的“開放”,讓云計算在未來的互聯(lián)網(wǎng)生態(tài)中越來越近。
未來“裝不下”云計算和大數(shù)據(jù)成新路
隨著互聯(lián)網(wǎng)迫切地“被需要”,一些問題也隨之而來。劉煬給出了一組數(shù)據(jù),2020年,全球?qū)⒂?60億物聯(lián)網(wǎng)設(shè)備,全球移動連接數(shù)量將大于1000億,目前僅約70億。同時,全球?qū)a(chǎn)生10倍于現(xiàn)在的海量數(shù)據(jù),并消耗完現(xiàn)有的所有電腦硬盤空間。
未來似乎已“裝不下”了,此時,云計算與大數(shù)據(jù)的出現(xiàn)給未來開了一扇窗。
百度已經(jīng)看到了這扇窗,有著強大的技術(shù)積累的百度,從2003年起,已在大規(guī)模地分布式應(yīng)用上進行研究,隨后,在分布式存儲、分布式的建設(shè)等方面,百度一直走在云計算和大數(shù)據(jù)的前沿,并一直在進行探索。
劉煬介紹,搜索是百度的業(yè)務(wù),百度能夠收納的網(wǎng)頁越多,就可以做得越大。目前,百度收錄了全世界超萬億網(wǎng)頁,存儲了100PB數(shù)據(jù),大約相當(dāng)于5000個國家圖書館的信息量總和。
“每天有幾十億的訪問,流量很大,有中國網(wǎng)民,也有國外的網(wǎng)民。從業(yè)務(wù)需求的驅(qū)動力來說,不管是網(wǎng)頁庫的規(guī)模,還是用戶訪問量的規(guī)模,我們必須做分布式的解決方案?!彼f,不僅規(guī)模大,多樣性也是百度的需求之一。
數(shù)據(jù)快速成長智能分析成必須
隨著業(yè)務(wù)的成長,數(shù)據(jù)量的成長也非??臁0俣葥碛写罅康臄?shù)據(jù),流量非常大,還在每天快速增長中。
數(shù)據(jù)可以幫助我們做什么?在劉煬看來,根據(jù)數(shù)據(jù),可以做大量的運營數(shù)據(jù)分析,可以幫助分析人員快速找到該做什么,什么樣的用戶體驗是好的。
“但光靠人的腦袋分析數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,因為當(dāng)數(shù)據(jù)量非常大的時候,光靠人找因果關(guān)系是不夠的?!彼J(rèn)為,在今天的大數(shù)據(jù)時代,其實人們在乎的不是因果關(guān)系,而是關(guān)聯(lián)關(guān)系。
“當(dāng)一個事發(fā)生的時候,另外一個事一定會發(fā)生,這不是靠人腦全部發(fā)現(xiàn)的,這導(dǎo)致百度除了可以處理很多數(shù)據(jù),還可以進行數(shù)據(jù)智能。千億的因素不可能用人腦搞清楚,這里需要用特別先進的技術(shù)去處理?!彼f。
數(shù)據(jù)的價值讓云計算和大數(shù)據(jù)在未來,成為一種必須。
工業(yè)制造中的云計算和大數(shù)據(jù)
“未來是大數(shù)據(jù)IoT的時代,除了電腦、筆記本、手機外,還有很多穿戴設(shè)備,比如手環(huán)和各種各樣的手表等,但這些設(shè)備遠(yuǎn)遠(yuǎn)不夠,我們相信在工業(yè)界的數(shù)據(jù)量也非常大,工業(yè)設(shè)備上會產(chǎn)生無窮多的數(shù)據(jù)?!眲J(rèn)為,在工業(yè)界,云計算和大數(shù)據(jù)也是必要的。
他舉例,今天,百度有幾十萬臺機器,每臺機器上有幾百萬個硬盤。幾百萬個硬盤就是產(chǎn)生大量數(shù)據(jù)的物聯(lián)網(wǎng)。因為這些硬盤都在進行著數(shù)據(jù)監(jiān)控,分析算術(shù)、溫度等等,百度監(jiān)督非常多的硬盤物理數(shù)據(jù),然后把物理數(shù)據(jù)匯集起來,進行學(xué)習(xí),對硬盤發(fā)生故障進行預(yù)測。
這樣的技術(shù),影響了百度整個工作的模式。百度可以提前把數(shù)據(jù)從故障盤遷移到其他硬盤中,使得硬盤損壞并不會對業(yè)務(wù)進行影響。此后,對硬盤進行休眠和批量的修理。
“除了在百度內(nèi)部應(yīng)用,我們和某一家風(fēng)電的公司也進行合作,在他們的設(shè)備上安裝監(jiān)控的采集器,采集分類設(shè)備的指標(biāo),并對分類設(shè)備出現(xiàn)的故障進行預(yù)測,這會大大降低公司的成本?!眲f。
據(jù)了解,2015產(chǎn)業(yè)互聯(lián)網(wǎng)大會由中國互聯(lián)網(wǎng)協(xié)會、中國新聞社主辦,中國新聞社浙江分社承辦。本次大會以“大智移云,產(chǎn)業(yè)互聯(lián)”為主題,以“互聯(lián) 網(wǎng)+制造”為核心,探討傳統(tǒng)產(chǎn)業(yè)在信息化互聯(lián)網(wǎng)時代的發(fā)展,交流在云計算大數(shù)據(jù)方面的新應(yīng)用。國內(nèi)領(lǐng)先的IT基礎(chǔ)架構(gòu)供應(yīng)商華三通信為大會提供網(wǎng)絡(luò)支 持。
大會是世界產(chǎn)業(yè)互聯(lián)網(wǎng)第一陣營中美德日的高峰對話:中國互聯(lián)網(wǎng)之母、原中科院副院長胡啟恒、美國工業(yè)互聯(lián)網(wǎng)聯(lián)盟理事長理查德博士、德國聯(lián)邦投資貿(mào)易 署駐華代表schoo、德國弗勞恩霍夫研究院智能無線研發(fā)首席科學(xué)家DirkReichelt博士現(xiàn)身杭州論劍。同時,微軟、GE、IBM、因特爾、西門子、寶馬、松下、阿里巴巴、華三、海爾、華為等名企高級負(fù)責(zé)人也均赴會。大會還發(fā)起在浙江杭州成立中美產(chǎn)業(yè)互聯(lián)網(wǎng)聯(lián)合實驗室,旨在加強中美在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng) 域交流與合作。(完)
官方微博
官方微信公眾號
官方百家號