據(jù)IDC剛剛公布的《數(shù)據(jù)時(shí)代2015》預(yù)測(cè)報(bào)告數(shù)據(jù)顯示,到2025年全球數(shù)據(jù)量有望達(dá)到163ZB,將是目前全球數(shù)據(jù)量的十倍。由萬(wàn)物互聯(lián)引發(fā)的數(shù)據(jù)大爆炸,對(duì)任何企業(yè)和個(gè)人而言,既是挑戰(zhàn),也是機(jī)遇。
如何在大數(shù)據(jù)時(shí)代利用大數(shù)據(jù)挖掘來(lái)獲得財(cái)富和機(jī)遇?傳統(tǒng)行業(yè)如何引入大數(shù)據(jù)技術(shù)為己所用?AI在大數(shù)據(jù)分析中有何作用和價(jià)值?圍繞業(yè)界普遍關(guān)心的熱點(diǎn)問(wèn)題,近日,《老尚看科技》采訪了聯(lián)想企業(yè)級(jí)大數(shù)據(jù)分析平臺(tái)LEAP(下文統(tǒng)一簡(jiǎn)稱為L(zhǎng)EAP)的相關(guān)負(fù)責(zé)人和技術(shù)專家,通過(guò)他們的專業(yè)回答,我們可以逐步看清大數(shù)據(jù)挖掘的實(shí)現(xiàn)路徑。
大數(shù)據(jù)平臺(tái)要有什么絕招,才能應(yīng)對(duì)數(shù)據(jù)大爆炸?
有專家曾經(jīng)預(yù)言,大數(shù)據(jù)將成為未來(lái)最重要的生產(chǎn)資料,大數(shù)據(jù)的挖掘、歸類、分析和利用能力的高低,很有可能會(huì)成為未來(lái)決定商業(yè)成敗的關(guān)鍵因素。就像石油驅(qū)動(dòng)著現(xiàn)代工業(yè)不斷向前,用計(jì)算驅(qū)動(dòng)數(shù)據(jù),正在成為驅(qū)動(dòng)科技和社會(huì)進(jìn)步的重要力量。
聯(lián)想是中國(guó)最早倡導(dǎo)和踐行中國(guó)智造的科技企業(yè)之一,而LEAP平臺(tái)則是聯(lián)想全球化運(yùn)營(yíng)和智能制造轉(zhuǎn)型的關(guān)鍵支點(diǎn)。據(jù)悉,目前聯(lián)想擁有大數(shù)據(jù)平臺(tái)開發(fā)與運(yùn)維人員超過(guò)500名,大數(shù)據(jù)專家、 數(shù)據(jù)科學(xué)家、與業(yè)務(wù)專家人數(shù)超過(guò)了50名;在全球部署了 9個(gè)數(shù)據(jù)中心, 擁有超過(guò)2000臺(tái)服務(wù)器,目前存儲(chǔ)總?cè)萘恳?guī)模已達(dá)15PB, 數(shù)據(jù)實(shí)際總量達(dá)到 12PB以上,日新增數(shù)據(jù)量約30TB,日處理涉及數(shù)據(jù)超過(guò)150億條,是國(guó)內(nèi)最大的制造企業(yè)數(shù)據(jù)集群。聯(lián)想的大數(shù)據(jù)處理能力僅次于BAT三大互聯(lián)網(wǎng)巨頭,其LEAP平臺(tái)目前已實(shí)現(xiàn)99.9%的全球高可用性。
在聯(lián)想大數(shù)據(jù)高級(jí)經(jīng)理張建偉看來(lái),簡(jiǎn)單的把數(shù)據(jù)收集上來(lái)做統(tǒng)計(jì)與整合,即使效率再高也很難給客戶帶來(lái)價(jià)值,真正能給客戶帶來(lái)價(jià)值的是海量數(shù)據(jù)的高效計(jì)算能力。通過(guò)人工智能、深度學(xué)習(xí)、知識(shí)圖譜以及包括數(shù)據(jù)分析等在內(nèi)的高端建模,來(lái)使這些數(shù)據(jù)和實(shí)際業(yè)務(wù)產(chǎn)生關(guān)聯(lián),從而對(duì)業(yè)務(wù)的運(yùn)營(yíng)、營(yíng)銷產(chǎn)生推動(dòng)、指導(dǎo),這樣才會(huì)產(chǎn)生所謂的“智”。
未來(lái)數(shù)據(jù)的激增,不只是企業(yè)數(shù)據(jù)中心產(chǎn)生的大量核心數(shù)據(jù),企業(yè)級(jí)計(jì)算機(jī)和設(shè)備產(chǎn)生的邊緣數(shù)據(jù),以及數(shù)以千億計(jì)的終端數(shù)據(jù)同樣也增長(zhǎng)迅猛,那么如何應(yīng)對(duì)大數(shù)據(jù)動(dòng)輒七八年就要暴增10倍的挑戰(zhàn)?
張建偉認(rèn)為,大數(shù)據(jù)時(shí)代真正來(lái)臨,有四大挑戰(zhàn)必須面臨和應(yīng)對(duì):
第一,海量數(shù)據(jù)的存儲(chǔ)。如何采集并存儲(chǔ)這些海量數(shù)據(jù)?這是聯(lián)想LEAP平臺(tái)、以及其他所有大數(shù)據(jù)平臺(tái)都面臨的問(wèn)題。從平臺(tái)層面來(lái)看,要看平臺(tái)的橫向擴(kuò)展應(yīng)用是否可以無(wú)縫銜接。假如達(dá)到100個(gè)節(jié)點(diǎn),擴(kuò)展將非常復(fù)雜,很可能會(huì)遇到由于數(shù)據(jù)翻倍增長(zhǎng)而帶來(lái)的處理時(shí)間不夠用等問(wèn)題。 聯(lián)想企業(yè)級(jí)大數(shù)據(jù)分析平臺(tái)的優(yōu)勢(shì)則體現(xiàn)在,LEAP Manager可以實(shí)現(xiàn)數(shù)據(jù)整個(gè)計(jì)算節(jié)點(diǎn)的動(dòng)態(tài)擴(kuò)展,包括數(shù)據(jù)的動(dòng)態(tài)分發(fā),這種方式不需要停機(jī),不需要停止現(xiàn)有的業(yè)務(wù)就可將原來(lái)10個(gè)節(jié)點(diǎn)的數(shù)據(jù)集群擴(kuò)展到100個(gè),甚至更多,整體數(shù)據(jù)量會(huì)自動(dòng)更新,客戶無(wú)需花費(fèi)精力關(guān)注數(shù)據(jù)如何更新。
第二,基于技術(shù)的演進(jìn),如何讓用戶無(wú)感地進(jìn)行更新。大數(shù)據(jù)是源于社區(qū)相關(guān)的技術(shù),其演進(jìn)迭代快速,基本上每年會(huì)有一個(gè)大版本的更新。基于不同大版本的演進(jìn),解決了包括產(chǎn)品自身的豐富性等問(wèn)題。很多平臺(tái)在版本迭代時(shí)很難做更新,尤其是一些開源技術(shù),在做大版本迭代的過(guò)程中,對(duì)底層日志或數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)都做了很多優(yōu)化或修改,基于現(xiàn)有正在運(yùn)行的業(yè)務(wù)系統(tǒng),很難將其業(yè)務(wù)及組件進(jìn)行升級(jí),而聯(lián)想LEAP平臺(tái)支持組件的滾動(dòng)升級(jí),通過(guò)LEAP Manager,用戶即可實(shí)現(xiàn)此項(xiàng)操作。
第三,海量數(shù)據(jù)的管理。物聯(lián)網(wǎng)的數(shù)據(jù)來(lái)自于多種終端,數(shù)據(jù)類型大多是是異構(gòu)多元的數(shù)據(jù),如何管理?聯(lián)想LEAP平臺(tái)的DataHub,能夠提供標(biāo)準(zhǔn)接口和標(biāo)準(zhǔn)可配置的模板,可以快速地對(duì)接口進(jìn)行擴(kuò)展。如果是標(biāo)準(zhǔn)接口,不需要做額外工作,就可以快速對(duì)數(shù)據(jù)進(jìn)行擴(kuò)展,來(lái)滿足數(shù)據(jù)增長(zhǎng)的新需求。
第四,新舊數(shù)據(jù)如何融合。聯(lián)想LEAP平臺(tái)上有自己的數(shù)據(jù)資產(chǎn)管理工具,能夠?qū)φw數(shù)據(jù)進(jìn)行分類和標(biāo)準(zhǔn)化,對(duì)數(shù)據(jù)質(zhì)量和生命周期進(jìn)行管理。海量數(shù)據(jù)進(jìn)來(lái)后如何使用,一定是需要依靠企業(yè)內(nèi)部的業(yè)務(wù)人員、管理人員和相關(guān)的行業(yè)專家、數(shù)據(jù)專家等,共同解決海量數(shù)據(jù)進(jìn)來(lái)后對(duì)客戶業(yè)務(wù)產(chǎn)生的影響、對(duì)業(yè)務(wù)優(yōu)化產(chǎn)生的新方向等問(wèn)題。
為了應(yīng)對(duì)數(shù)據(jù)大爆炸的挑戰(zhàn),聯(lián)想LEAP平臺(tái)還有一個(gè)秘密武器,即LEAP AI。LEAP AI可以通過(guò)深度學(xué)習(xí)相關(guān)的算法和行業(yè)應(yīng)用,把聯(lián)想之前的成功案例和算法全部集中起來(lái),幫助客戶快速認(rèn)知新數(shù)據(jù)所帶來(lái)的業(yè)務(wù)價(jià)值,以及快速挖掘新數(shù)據(jù)所帶來(lái)的影響。
大數(shù)據(jù)挖掘,聯(lián)想有七種武器
大數(shù)據(jù)是一座公認(rèn)的金礦,而如何挖掘各家各有套路。據(jù)張建偉介紹,聯(lián)想大數(shù)據(jù)的核心就是聯(lián)想LEAP平臺(tái),圍繞LEAP平臺(tái)的核心計(jì)算能力、存儲(chǔ)能力以及數(shù)據(jù)采集能力,聯(lián)想構(gòu)建了七種服務(wù),也成為大數(shù)據(jù)分析的七種武器。
第一種服務(wù),規(guī)劃和設(shè)計(jì)的服務(wù)。很多企業(yè)在做大數(shù)據(jù)或應(yīng)用大數(shù)據(jù)的過(guò)程中走了一些彎路,究其原因,往往源于頂層設(shè)計(jì)不夠清晰,先從底層技術(shù)變革去推動(dòng),然后慢慢用敏捷迭代的形式去完善。所以,聯(lián)想在總結(jié)經(jīng)驗(yàn)之后,把咨詢服務(wù)放在所有項(xiàng)目實(shí)施之前,聯(lián)想的大數(shù)據(jù)專家會(huì)基于聯(lián)想大數(shù)據(jù)LEAP平臺(tái)幫助客戶提供規(guī)劃設(shè)計(jì)服務(wù)。
第二種服務(wù),平臺(tái)搭建服務(wù)。對(duì)于那些已經(jīng)很清楚數(shù)據(jù)來(lái)源及如何使用的行業(yè)客戶,他們?nèi)鄙俚氖前〝?shù)據(jù)計(jì)算、收集等在內(nèi)的基礎(chǔ)承載平臺(tái)。聯(lián)想的渠道伙伴中不乏一些行業(yè)應(yīng)用經(jīng)驗(yàn)豐富的ISV,但這些ISV缺乏底層的基礎(chǔ)平臺(tái)對(duì)大數(shù)據(jù)進(jìn)行深度的挖掘和支撐。同時(shí)從大數(shù)據(jù)平臺(tái)的研發(fā)成本和時(shí)間周期上來(lái)看,很多ISV又無(wú)法把更多的精力側(cè)重于基礎(chǔ)平臺(tái)的研究。他們更多的是側(cè)重于行業(yè),包括某一個(gè)領(lǐng)域縱向的深入挖掘。這時(shí),他們就需要一個(gè)強(qiáng)大的服務(wù)商或供應(yīng)商,來(lái)幫助他們提供平臺(tái),包括基于其業(yè)務(wù)場(chǎng)景的一些平臺(tái)大數(shù)據(jù)技術(shù)的深度優(yōu)化和服務(wù)。
第三,是數(shù)據(jù)質(zhì)量、數(shù)據(jù)管理服務(wù)。數(shù)據(jù)往往具有海量、多元、異構(gòu)的特征,針對(duì)這些數(shù)據(jù),如何在企業(yè)層面對(duì)數(shù)據(jù)的標(biāo)準(zhǔn)、質(zhì)量、安全及整個(gè)數(shù)據(jù)生命周期進(jìn)行管理很關(guān)鍵。這一套數(shù)據(jù)治理,不是一個(gè)工具可以解決的,更多的是通過(guò)咨詢、服務(wù)去幫助客戶梳理構(gòu)建業(yè)務(wù)流程和體系,將整個(gè)數(shù)據(jù)資產(chǎn)梳理清楚,以便于其對(duì)數(shù)據(jù)資產(chǎn)更好地掌控及應(yīng)用。
第四,是定制化的服務(wù)。在中國(guó)不同的行業(yè),甚至不同行業(yè)的不同環(huán)節(jié),不同的縱向生產(chǎn)環(huán)節(jié),服務(wù)都是不一樣的。在應(yīng)用層面及大數(shù)據(jù)層面,除了底層的計(jì)算技術(shù)以外,偏應(yīng)用層面的技術(shù)很多都需要定制化開發(fā)。比如,相關(guān)的算法,在不同的應(yīng)用場(chǎng)景上都需要做針對(duì)性的優(yōu)化和調(diào)整。聯(lián)想LEAP平臺(tái)可以提供相關(guān)的定制化服務(wù),包括聯(lián)想大數(shù)據(jù)科學(xué)家團(tuán)隊(duì)、工程實(shí)施團(tuán)隊(duì),都可以專門為客戶提供更多的定制化開發(fā)服務(wù)。
第五,是集成開發(fā)。現(xiàn)在很多客戶,包括一些大客戶更喜歡交鑰匙工程,這就涉及到整體的系統(tǒng)集成,聯(lián)想有自己的硬件、軟件,又有自己的實(shí)施團(tuán)隊(duì),所以聯(lián)想可以提供給客戶一個(gè)完整的集成方案。
第六,統(tǒng)一的運(yùn)維服務(wù)。現(xiàn)在大數(shù)據(jù)的平臺(tái)對(duì)很多企業(yè)而言,尤其對(duì)傳統(tǒng)企業(yè)而言,運(yùn)維存在一定的風(fēng)險(xiǎn)和技術(shù)瓶頸。第一,技術(shù)不斷迭代,演進(jìn)太快;第二,原有人員在學(xué)習(xí)大數(shù)據(jù)時(shí)需要時(shí)間、成本,還有一些企業(yè)將IT作為輕資產(chǎn),運(yùn)維人員很難去滿足大數(shù)據(jù)相關(guān)的分析及運(yùn)維相關(guān)的服務(wù),因此,聯(lián)想認(rèn)為有必要以統(tǒng)一運(yùn)維的形式,給企業(yè)提供相關(guān)的運(yùn)維服務(wù)。
第七,是數(shù)據(jù)變現(xiàn)服務(wù)。目前聯(lián)想在數(shù)據(jù)變現(xiàn)方面的合作伙伴,包括了很多行業(yè)巨頭,一起做數(shù)據(jù)變現(xiàn)的前沿探索,如何整合資源和渠道,將數(shù)據(jù)真正的去變現(xiàn)。
在張建偉看來(lái),聯(lián)想LEPA平臺(tái)其實(shí)是一個(gè)端到端服務(wù)的提供者,既有產(chǎn)品的服務(wù),又有相關(guān)的行業(yè)應(yīng)用增值服務(wù),還包括相關(guān)的運(yùn)營(yíng)服務(wù),核心目的是利用上述的七種武器幫助客戶解決大數(shù)據(jù)應(yīng)用及發(fā)展相關(guān)的問(wèn)題。
要進(jìn)行大數(shù)據(jù)分析,是不是非得推倒重來(lái)?
新建一座城市其實(shí)并不難,但改造一座歷史悠久的老城卻要難得多,因?yàn)橐紤]用兼容并包來(lái)解決新老并存的問(wèn)題。現(xiàn)在很多企業(yè)和行業(yè)客戶,都躍躍欲試要做大數(shù)據(jù)深度挖掘和利用,但他們已有的IT系統(tǒng)是否就得推倒重來(lái)?進(jìn)行大數(shù)據(jù)挖掘的新嘗試,能否盡可能利用和保護(hù)已有的IT資產(chǎn)?
張建偉在接受采訪時(shí)表示,如何保護(hù)已有的IT資產(chǎn),是在大數(shù)據(jù)項(xiàng)目實(shí)施過(guò)程中常遇到的問(wèn)題。事實(shí)上,聯(lián)想LEAP平臺(tái)可以做到跨品牌兼容,無(wú)論部署聯(lián)想還是其他品牌的產(chǎn)品,聯(lián)想LEAP平臺(tái)都可以很好的兼容,但會(huì)對(duì)聯(lián)想產(chǎn)品有更深度的優(yōu)化,這能在很大程度上保護(hù)了用戶已有的IT投資。
但依照張建偉的經(jīng)驗(yàn),保護(hù)客戶已有的投資和利益,并不意味著要全盤接受那些已經(jīng)落伍陳舊的設(shè)備,像鋼鐵、鋁業(yè)等重資產(chǎn)行業(yè),一些老舊的設(shè)備可能服役已經(jīng)幾十年,想要在這些設(shè)備商采集數(shù)據(jù)難度非常大,所以聯(lián)想在幫用戶落地大數(shù)據(jù)分析平臺(tái)項(xiàng)目之前,會(huì)讓相應(yīng)的技術(shù)專家對(duì)客戶的實(shí)際情況進(jìn)行摸底,就像給房子做裝修服務(wù),裝修設(shè)計(jì)師一定會(huì)先出設(shè)計(jì),告訴用戶哪些還可以保留利用,哪些需要徹底重來(lái),直到用戶對(duì)方案和預(yù)算認(rèn)可之后才開始動(dòng)工。
張建偉表示,大數(shù)據(jù)項(xiàng)目的實(shí)施,一味激進(jìn)并不是好的選擇,聯(lián)想認(rèn)為比較理想的方案推進(jìn)可以分三步來(lái)走:第一,針對(duì)自己沒(méi)有想清楚大數(shù)據(jù)應(yīng)該怎么做的客戶,或?qū)Υ髷?shù)據(jù)的分析存在很多疑惑的客戶,聯(lián)想LEAP平臺(tái)的專家們會(huì)先摸清其實(shí)際IT現(xiàn)狀;第二,會(huì)摸清其實(shí)際業(yè)務(wù)的痛點(diǎn),上大數(shù)據(jù)最終是要解決業(yè)務(wù)的問(wèn)題;第三,助其規(guī)劃整個(gè)大數(shù)據(jù)實(shí)施的戰(zhàn)略和Roadmap。這樣可以很好地幫助企業(yè)花最少的錢實(shí)現(xiàn)最佳的效果,同時(shí)也能節(jié)省更多的時(shí)間。
大數(shù)據(jù)掘金,不同于美國(guó)西部的淘金熱,憑借著簡(jiǎn)陋的工具就可以試試運(yùn)氣,說(shuō)到底,大數(shù)據(jù)掘金必須依靠專業(yè)的計(jì)算、存儲(chǔ)和分析工具以及服務(wù),而大數(shù)據(jù)采集、整理和分析利用能力,莫說(shuō)是中小企業(yè),即便是大型企業(yè)也很難具備,所以像聯(lián)想LEAP平臺(tái)這樣專業(yè)的大數(shù)據(jù)分析和服務(wù)平臺(tái)會(huì)應(yīng)運(yùn)而生、順勢(shì)成長(zhǎng)。大數(shù)據(jù)服務(wù)會(huì)成為未來(lái)熱門的社會(huì)化服務(wù)新品類,在云計(jì)算的驅(qū)動(dòng)之下,成為商業(yè)模式創(chuàng)新和產(chǎn)品服務(wù)創(chuàng)新的重要支撐點(diǎn)。
面對(duì)數(shù)據(jù)大爆炸的現(xiàn)實(shí)挑戰(zhàn),是繼續(xù)被動(dòng)觀望,還是主動(dòng)擁抱變革?企業(yè)和行業(yè)客戶在今天所做的不同選擇,決定著未來(lái)不同的命運(yùn)走向。