尊敬的各位領(lǐng)導,非常榮幸有機會能夠參加論壇,我本人到江蘇來過很多次,江蘇的產(chǎn)業(yè)發(fā)展給我留下了深刻的印象。不光是南京,蘇錫常還有包括其他的城市,經(jīng)濟活躍、產(chǎn)業(yè)發(fā)展都給我留下了很深的印象。
我今天的話題是結(jié)合會議主題說說我的看法,我現(xiàn)在要說明的一點是什么呢?我其實不懂數(shù)據(jù)科學,數(shù)據(jù)科學并不是我的專業(yè),但很多年來我都很關(guān)心數(shù)據(jù)科學的發(fā)展。像以前制造業(yè)信息化,數(shù)字化制造。今天我們講智能制造,這是我所關(guān)心的,我說說我的看法,不對的地方大家批評。
其實幾年前奧巴馬和美國國會提交的一份報告里談到:科技不只是在取代組裝流水線上的工作,而是在影響任何可以被自動化的工作。即傳統(tǒng)的自動化替代的是人的體力,但未來不一樣,簡單地講是指人的腦力。
最近大眾的CEO說:不遠的將來汽車將成為一個軟件產(chǎn)品,大眾也會成為一家軟件驅(qū)動的公司。我們很多人聽到后都會感到不解,汽車是一個硬梆梆的產(chǎn)品,怎么會是一個軟件產(chǎn)品呢?我認為這句話有兩層意思,一是指汽車未來所應用的軟件產(chǎn)品會越來越多,尤其是自動駕駛,無人駕駛汽車。
二是指影響未來汽車競爭力的主要因素是軟件,而不是硬件。我們現(xiàn)在有個話題是“軟件定義世界,數(shù)據(jù)驅(qū)動未來”,二者是緊緊聯(lián)系在一起的。有人講未來世界,我就說數(shù)據(jù)世界或者軟件,與其相關(guān)的大量問題都是處理數(shù)據(jù)。正如剛才說的汽車是一個軟件產(chǎn)品,由于有軟件產(chǎn)品很多都是和數(shù)據(jù)緊密聯(lián)系在一起的,汽車就會和智慧城市里的很多數(shù)據(jù)關(guān)聯(lián)在一起。
下面我將會說三個話題,首先我們從自動化說起,之后會介紹理念的數(shù)據(jù),最后會說明數(shù)據(jù)的理念。
傳統(tǒng)自動化是替代人的體力的,我們現(xiàn)在比較完善的自動化可以處理一些結(jié)構(gòu)化的、固定模式的、確定性的問題。目前少數(shù)非結(jié)構(gòu)化的問題無法通過自動化處理。未來的自動化不僅包括目前已經(jīng)完善的自動化,還會像奧巴馬所說的替代一切的自動化。
人的腦力包含很多東西,實際上它是非結(jié)構(gòu)化的,沒有固定模式,是一個不確定性的問題。這些問題的處理我們以前沒有什么好的手段。實際上,這些問題需要認知自動化來處理。智能自動是另外一種自動化替代人的腦力的技術(shù)。所以替代腦力這個數(shù)字智能時代的自動化替代腦力,我們講它超越固定的模式,有些問題沒有固定的模式,例如,一個車間里節(jié)能的問題并不是一臺設備上節(jié)能的問題,它沒有一個固定的模式,你沒有辦法用一個模型去表達,車間節(jié)能的設備沒法創(chuàng)建一個模型,此時我們可能就需要用超越模型來處理。
當然,有時候我們可以通過數(shù)據(jù)去發(fā)現(xiàn)模型,參數(shù)化模型等。我們需要超越確定性的問題,從而有辦法處理不確定性的問題。
工業(yè)中最重要的是制造,不管是設計效率、質(zhì)量、成本、綠色等,所有這些問題實際上都存在著大量不確定性,如果我們想清晰地認識,乃至駕馭企業(yè)活動那么認識這個企業(yè)的整體聯(lián)系就會非常重要。
另外,非固定模式不確定性的問題是以前對我們來講比較困擾的問題,系統(tǒng)到底有多少是相關(guān)聯(lián)的?例如,我們?nèi)司褪且粋€很復雜的系統(tǒng),到底人有多少因素相互關(guān)聯(lián),怎么關(guān)聯(lián)?因此,大數(shù)據(jù)、人工智能等的出現(xiàn)就像開啟了一扇大門,有可能促使我們?nèi)フJ識整體聯(lián)系、非結(jié)構(gòu)化的問題、不確定性的問題等等。
我們可以想想中國的傳統(tǒng)文化。中國古代的金木水火土,的確不能說它是科學的。但我們古人的這種認識還是有一定的合理性的,它強調(diào)了整體的聯(lián)系。西醫(yī)常常是“頭疼醫(yī)頭,腳疼醫(yī)腳”,但中醫(yī)是聯(lián)系整體來看的,即頭疼是由于腳上的某個穴位引起的,只是我們現(xiàn)在無法從解剖學的角度去認識它。我曾經(jīng)腰痛到臥床的地步,后來通過針灸就好了。
所以對于一個復雜系統(tǒng)來講,其整體的聯(lián)系是非常重要的。我們強調(diào)中國文化里大系統(tǒng)觀整體聯(lián)系,它是有合理解釋的,只是以前的現(xiàn)代科學缺乏技術(shù)去認識它。我們古人是通過經(jīng)驗、感悟去互聯(lián)的。但現(xiàn)在我們不能通過經(jīng)驗感悟去處理很多問題,只能通過數(shù)據(jù)科學、人工智能技術(shù)等去認識這些整體聯(lián)系,不確定性的問題等等。
要認識整體聯(lián)系或控制一些非固定模式,不確定性問題的基礎是數(shù)據(jù),但有數(shù)據(jù)就要互聯(lián)。我們需要人工智能技術(shù)去決策控制一些非模式、不確定性的問題,而且人工智能技術(shù)也是以數(shù)據(jù)為基礎。
因此有了第三次數(shù)字化浪潮,早期的數(shù)據(jù)驅(qū)動過程,比如我們在企業(yè)里的數(shù)控機床加工過程就是數(shù)據(jù)驅(qū)動的。在數(shù)據(jù)驅(qū)動相關(guān)的一些問題中,現(xiàn)在我們強調(diào)數(shù)據(jù)驅(qū)動企業(yè),我們講數(shù)據(jù)化、智能制造,數(shù)據(jù)驅(qū)動,這是我覺得我們從事數(shù)據(jù)科學的人需要要關(guān)注的。當然未來將會涉及到更多的關(guān)鍵技術(shù),包括人工智能、5G、區(qū)塊鏈等等。
所謂理念的數(shù)據(jù),就是圍繞企業(yè)的理念去收集處理數(shù)據(jù)。例如,像海爾這樣的現(xiàn)代企業(yè)的基本理念就是“以客戶為中心”,因此,海爾創(chuàng)建了一個工業(yè)互聯(lián)網(wǎng)平臺,收集了大量的客戶數(shù)據(jù),從而能夠在產(chǎn)品開發(fā)階段通過客戶數(shù)據(jù)把用戶的碎片化需求進行集成,與用戶交互,實現(xiàn)“以客戶為中心”的目標。顯然,圍繞企業(yè)“以客戶為中心”的理念集成數(shù)據(jù)是非常重要。
所以海爾的研發(fā)模式與傳統(tǒng)的瀑布式模式不同。瀑布式模式是通過市場調(diào)查進行需求分析,之后研發(fā)產(chǎn)品;即是先有產(chǎn)品再有客戶。而海爾的研發(fā)模式是在產(chǎn)品開發(fā)的過程中通過網(wǎng)絡,即互聯(lián)網(wǎng)平臺與用戶迭代、交互,根據(jù)客戶的需求生產(chǎn)產(chǎn)品;既是先有用戶再有產(chǎn)品。因此,理念的數(shù)據(jù)引起了研發(fā)模式的顛覆。
再如,“綠色”也是現(xiàn)代企業(yè)的一個重要的理念?!熬G色”不光是指沒有污染,也指資源消耗少。雖然美國的用電很便宜,但DeepMind谷歌數(shù)據(jù)中心的耗電量很大。后來通過改進DeepMind把耗電降低了15%,且實現(xiàn)了設備投資的收回。事實上,他們通過數(shù)據(jù)中心幾千個傳感器去收集溫度、電量、耗電量等設備及建筑物的結(jié)構(gòu)(不同數(shù)據(jù)中心建筑物的結(jié)構(gòu)都不一樣)數(shù)據(jù),之后對數(shù)據(jù)進行深度學習等處理實現(xiàn)節(jié)能效果。顯然,該例中數(shù)據(jù)收集的標準即為節(jié)能的理念、綠色的理念。因此,類似這類問題是完全沒有固定模式的,我們不可能通過創(chuàng)建模型來解決。
這樣的技術(shù)也可以被用在其他方面。如減少半導體生產(chǎn),半導體耗水很厲害;幫助企業(yè)提高生產(chǎn)效率等。同樣我們國內(nèi)也有應用很好的例子,例如酒鋼鋼鐵企業(yè)為了節(jié)能減排,在高樓上面安裝了很多傳感器,效果非常好,平均提高勞動生產(chǎn)力5%,降低純鐵成本15元,預期在全行業(yè)推廣后,直接經(jīng)濟效益70億元/年。
接下來介紹數(shù)據(jù)的理念,首先數(shù)據(jù)里面實際上隱含著另外一種存在,以尿布和啤酒為例,雖然超市專家以前沒有意識到,但尿布和啤酒銷售存在關(guān)聯(lián)。我們很多觀點消失在人們的眼睛中,人們看不到,也淹沒在人們的模糊感覺中。
我們有時候可以在相似中發(fā)現(xiàn)一些顯著的差異,例如Lexus通過Twitter大數(shù)據(jù)分析,從倫敦奧運會冠軍中篩選廣告代言人。無論邀請姚明還是劉翔都具有相似性,他們都是體育明星,但他們還是有差異的,就需要通過數(shù)據(jù)去分析了解。另外,我們可以在巨大的差異之間發(fā)現(xiàn)相似的規(guī)律,例如,AlphaGo在所有的圍棋對局中,每一個人哪怕是同一個選手,每次對局都很不一樣,所以就要從很多的差異中尋找相似的規(guī)律,得到新的認識。
對于企業(yè)來說,以財務信息和業(yè)務信息的融合為例。實際上,很多企業(yè)的財務信息和業(yè)務信息并沒有很好地融合,就車間里一些具體設計業(yè)務的工藝來說,生產(chǎn)上方方面面的信息并沒有真正地被財務信息所利用,但實際上這個業(yè)務流程是和財務信息相關(guān)的。我們沒有精細的數(shù)據(jù)收集,所以傳統(tǒng)的信息和業(yè)務信息相互獨立。因此如何從大量的信息中進行挖掘,進行成本控制是非常有意義的工作。
其次,隱處的另外一種存在淹沒在人的自以為是中,AlphaGo這是臭棋,實際上AlphaGo對圍棋有新的認識,這是人類沒有認識到的。有的緊閉地存在深處,有超越人的智慧,特別的思維過程。所以我認為數(shù)據(jù)其實是“非人類思維”的種子。像AlphaGo有非人類的思維,人類以前沒意識到一樣,數(shù)據(jù)是“非人類思維”的種子,我們?nèi)绾螐臄?shù)據(jù)到信息,到智能,再到非人類思維。這對我們認識自動化是非常重要的。
我們要超越人的感知,例如,我?guī)讉€月前去臺灣一個很普通的大學參觀,其中的一個教授說:控制磨床進刀,老師傅通過聽模具的聲音可以判別出其質(zhì)量如何,或者應該如何去控制。然而,他們通過測量噪聲,噪聲要測量很容易,測量電流的變化,把數(shù)據(jù)收集起來和質(zhì)量等進行深度學習。結(jié)果顯示數(shù)據(jù)分析之后的磨床進刀控制要比人的感知好得多。
剛才所說的AlphaGo實際上就是非人類思維。最可怕的不是人類,是非人類思維。在很多情況下,計算機系統(tǒng),人工智能系統(tǒng)可能比我們的看法或感知更加細致入微。
以我的一個計算機繪畫作品為例,它實際上是根據(jù)我們拍的樹林的照片畫出的作品。我們?nèi)俗鳟嫷臅r候,有的地方透著光,有的地方有陰影;但計算機繪畫實際上是計算機對照片的分析,它更加的細致入微,用一種夸張的手法表現(xiàn)了出來。這說明了計算機或者人工智能系統(tǒng)比人的感知更加細致入微。
另外,關(guān)于數(shù)據(jù)的理念,我們需要重視數(shù)據(jù)收集常常需要跨系統(tǒng)、跨領(lǐng)域、跨媒體的,某一個問題的表征并不一定集中在某一個特定的系統(tǒng)數(shù)據(jù)之中。例如美國大選時特朗普當選很意外,美國主流媒體認為特朗普不可能當選。如果跨媒體收集數(shù)據(jù),絕對不會得出特朗普敗選的結(jié)論。因為人們只關(guān)注了主流媒體,沒有看民間媒體,所以才會感到意外。再如我們要判斷經(jīng)濟趨勢,判斷選民的意向,光看報紙是不行的,還需要我們?nèi)タ缦到y(tǒng),跨媒體了解相關(guān)信息。
我們車間的質(zhì)量問題不一定只和設備、工具、工人有關(guān)系,還會涉及到供應商、環(huán)境、氣候,甚至是某一特定的時期,社會上的特定活動等。就以正在舉行的世界杯為例,車間的質(zhì)量說不定與這些比賽有關(guān)。跨媒體也是一個很重要的方面,收集不同媒體的數(shù)據(jù),例如facebook,微信,中央電視臺等。這些媒體都傳遞了很多數(shù)據(jù),而且這些數(shù)據(jù)可以從一定的程度上反映經(jīng)濟問題,經(jīng)濟趨勢等。
之后,我們介紹數(shù)據(jù)的工作理念,在企業(yè)中,我們常說業(yè)務數(shù)據(jù)化、數(shù)據(jù)業(yè)務化。所謂業(yè)務數(shù)據(jù)化,即企業(yè)里每一項工作,每一個活動,每一項業(yè)務都要數(shù)據(jù)化。我們企業(yè)遠遠沒有達到業(yè)務數(shù)據(jù)化。所謂叫數(shù)據(jù)業(yè)務化,即指數(shù)據(jù)工作是由專門的業(yè)務部門來處理。目前政府部門已有專門的部門來處理數(shù)據(jù),如大數(shù)據(jù)局。但是在企業(yè)中,我們所有計算機中心或信息中心和數(shù)據(jù)中心是不同的。專門處理企業(yè)數(shù)據(jù)收集的范圍,數(shù)據(jù)傳送的標準等和數(shù)據(jù)相關(guān)的部門才是數(shù)據(jù)中心。
還有大家熟悉的數(shù)字雙胞胎的理念,在企業(yè)里現(xiàn)在非常強的。在企業(yè)中,數(shù)據(jù)驅(qū)動強調(diào)的是無數(shù)的流動。企業(yè)數(shù)據(jù)驅(qū)動包括在流水線上的。例如,德國巴斯夫企業(yè)生產(chǎn)的洗發(fā)水、液體肥皂是可以根據(jù)香味和顏色等喜好定制的,而且定制過程是根據(jù)記錄了數(shù)據(jù)的芯片實現(xiàn)的,體現(xiàn)了數(shù)據(jù)驅(qū)動。而雙胞胎強調(diào)的是數(shù)據(jù)從一個程序無縫流到另一個程序的過程。
最后,需要注意的是,不要指望一切都在預測和控制之中。近幾年有專家說:大數(shù)據(jù)、人工智能計劃經(jīng)濟成為可能,馬云也有這樣的觀點,認為什么都可以掌握,但我覺得這是不可能的。人是有自由意志的,你發(fā)布了什么計劃,你一定要我種花生,那我想種別的東西,假如說我是一個農(nóng)民的話,除非你規(guī)定任何你只能夠生產(chǎn)什么、工作什么,這個是不可能的事情。如果說你有一些預測,而我因為你的預測馬上做出改變。顯然,經(jīng)過改變,原來的東西實際上已經(jīng)發(fā)生了變化。因此,很多個體行為是無法預測的,但對一個群體來說,預測又是可能的,因為群體之內(nèi)的自由意志可能相互平衡抵消。但我們認為一切都在掌控之中、控制之中是不大可能的。
另外不能迷信數(shù)字與智能技術(shù),數(shù)字與智能技術(shù)依然存在漏洞。更復雜的社會,也意味著更復雜的糾錯機制、更高昂的糾錯成本。正如墨菲定律所說,“如果事情有變壞的可能,不管這種可能性有多小,它總會發(fā)生?!蔽蚁嘈胚@句話還是有一定道理的。
總之,數(shù)據(jù)驅(qū)動不是一切,大數(shù)據(jù)、人工智能開啟了認識整體聯(lián)系,認識不確定性,認識非固定模式等問題的大門。我們應該圍繞企業(yè)的理念和目標去收集、處理數(shù)據(jù)。嘗試去深刻地理解數(shù)據(jù)的一些基本理念等。
尊敬的各位領(lǐng)導,非常榮幸有機會能夠參加論壇,我本人到江蘇來過很多次,江蘇的產(chǎn)業(yè)發(fā)展給我留下了深刻的印象。不光是南京,蘇錫常還有包括其他的城市,經(jīng)濟活躍、產(chǎn)業(yè)發(fā)展都給我留下了很深的印象。
我今天的話題是結(jié)合會議主題說說我的看法,我現(xiàn)在要說明的一點是什么呢?我其實不懂數(shù)據(jù)科學,數(shù)據(jù)科學并不是我的專業(yè),但很多年來我都很關(guān)心數(shù)據(jù)科學的發(fā)展。像以前制造業(yè)信息化,數(shù)字化制造。今天我們講智能制造,這是我所關(guān)心的,我說說我的看法,不對的地方大家批評。
其實幾年前奧巴馬和美國國會提交的一份報告里談到:科技不只是在取代組裝流水線上的工作,而是在影響任何可以被自動化的工作。即傳統(tǒng)的自動化替代的是人的體力,但未來不一樣,簡單地講是指人的腦力。
最近大眾的CEO說:不遠的將來汽車將成為一個軟件產(chǎn)品,大眾也會成為一家軟件驅(qū)動的公司。我們很多人聽到后都會感到不解,汽車是一個硬梆梆的產(chǎn)品,怎么會是一個軟件產(chǎn)品呢?我認為這句話有兩層意思,一是指汽車未來所應用的軟件產(chǎn)品會越來越多,尤其是自動駕駛,無人駕駛汽車。
二是指影響未來汽車競爭力的主要因素是軟件,而不是硬件。我們現(xiàn)在有個話題是“軟件定義世界,數(shù)據(jù)驅(qū)動未來”,二者是緊緊聯(lián)系在一起的。有人講未來世界,我就說數(shù)據(jù)世界或者軟件,與其相關(guān)的大量問題都是處理數(shù)據(jù)。正如剛才說的汽車是一個軟件產(chǎn)品,由于有軟件產(chǎn)品很多都是和數(shù)據(jù)緊密聯(lián)系在一起的,汽車就會和智慧城市里的很多數(shù)據(jù)關(guān)聯(lián)在一起。
下面我將會說三個話題,首先我們從自動化說起,之后會介紹理念的數(shù)據(jù),最后會說明數(shù)據(jù)的理念。
傳統(tǒng)自動化是替代人的體力的,我們現(xiàn)在比較完善的自動化可以處理一些結(jié)構(gòu)化的、固定模式的、確定性的問題。目前少數(shù)非結(jié)構(gòu)化的問題無法通過自動化處理。未來的自動化不僅包括目前已經(jīng)完善的自動化,還會像奧巴馬所說的替代一切的自動化。
人的腦力包含很多東西,實際上它是非結(jié)構(gòu)化的,沒有固定模式,是一個不確定性的問題。這些問題的處理我們以前沒有什么好的手段。實際上,這些問題需要認知自動化來處理。智能自動是另外一種自動化替代人的腦力的技術(shù)。所以替代腦力這個數(shù)字智能時代的自動化替代腦力,我們講它超越固定的模式,有些問題沒有固定的模式,例如,一個車間里節(jié)能的問題并不是一臺設備上節(jié)能的問題,它沒有一個固定的模式,你沒有辦法用一個模型去表達,車間節(jié)能的設備沒法創(chuàng)建一個模型,此時我們可能就需要用超越模型來處理。
當然,有時候我們可以通過數(shù)據(jù)去發(fā)現(xiàn)模型,參數(shù)化模型等。我們需要超越確定性的問題,從而有辦法處理不確定性的問題。
工業(yè)中最重要的是制造,不管是設計效率、質(zhì)量、成本、綠色等,所有這些問題實際上都存在著大量不確定性,如果我們想清晰地認識,乃至駕馭企業(yè)活動那么認識這個企業(yè)的整體聯(lián)系就會非常重要。
另外,非固定模式不確定性的問題是以前對我們來講比較困擾的問題,系統(tǒng)到底有多少是相關(guān)聯(lián)的?例如,我們?nèi)司褪且粋€很復雜的系統(tǒng),到底人有多少因素相互關(guān)聯(lián),怎么關(guān)聯(lián)?因此,大數(shù)據(jù)、人工智能等的出現(xiàn)就像開啟了一扇大門,有可能促使我們?nèi)フJ識整體聯(lián)系、非結(jié)構(gòu)化的問題、不確定性的問題等等。
我們可以想想中國的傳統(tǒng)文化。中國古代的金木水火土,的確不能說它是科學的。但我們古人的這種認識還是有一定的合理性的,它強調(diào)了整體的聯(lián)系。西醫(yī)常常是“頭疼醫(yī)頭,腳疼醫(yī)腳”,但中醫(yī)是聯(lián)系整體來看的,即頭疼是由于腳上的某個穴位引起的,只是我們現(xiàn)在無法從解剖學的角度去認識它。我曾經(jīng)腰痛到臥床的地步,后來通過針灸就好了。
所以對于一個復雜系統(tǒng)來講,其整體的聯(lián)系是非常重要的。我們強調(diào)中國文化里大系統(tǒng)觀整體聯(lián)系,它是有合理解釋的,只是以前的現(xiàn)代科學缺乏技術(shù)去認識它。我們古人是通過經(jīng)驗、感悟去互聯(lián)的。但現(xiàn)在我們不能通過經(jīng)驗感悟去處理很多問題,只能通過數(shù)據(jù)科學、人工智能技術(shù)等去認識這些整體聯(lián)系,不確定性的問題等等。
要認識整體聯(lián)系或控制一些非固定模式,不確定性問題的基礎是數(shù)據(jù),但有數(shù)據(jù)就要互聯(lián)。我們需要人工智能技術(shù)去決策控制一些非模式、不確定性的問題,而且人工智能技術(shù)也是以數(shù)據(jù)為基礎。
因此有了第三次數(shù)字化浪潮,早期的數(shù)據(jù)驅(qū)動過程,比如我們在企業(yè)里的數(shù)控機床加工過程就是數(shù)據(jù)驅(qū)動的。在數(shù)據(jù)驅(qū)動相關(guān)的一些問題中,現(xiàn)在我們強調(diào)數(shù)據(jù)驅(qū)動企業(yè),我們講數(shù)據(jù)化、智能制造,數(shù)據(jù)驅(qū)動,這是我覺得我們從事數(shù)據(jù)科學的人需要要關(guān)注的。當然未來將會涉及到更多的關(guān)鍵技術(shù),包括人工智能、5G、區(qū)塊鏈等等。
所謂理念的數(shù)據(jù),就是圍繞企業(yè)的理念去收集處理數(shù)據(jù)。例如,像海爾這樣的現(xiàn)代企業(yè)的基本理念就是“以客戶為中心”,因此,海爾創(chuàng)建了一個工業(yè)互聯(lián)網(wǎng)平臺,收集了大量的客戶數(shù)據(jù),從而能夠在產(chǎn)品開發(fā)階段通過客戶數(shù)據(jù)把用戶的碎片化需求進行集成,與用戶交互,實現(xiàn)“以客戶為中心”的目標。顯然,圍繞企業(yè)“以客戶為中心”的理念集成數(shù)據(jù)是非常重要。
所以海爾的研發(fā)模式與傳統(tǒng)的瀑布式模式不同。瀑布式模式是通過市場調(diào)查進行需求分析,之后研發(fā)產(chǎn)品;即是先有產(chǎn)品再有客戶。而海爾的研發(fā)模式是在產(chǎn)品開發(fā)的過程中通過網(wǎng)絡,即互聯(lián)網(wǎng)平臺與用戶迭代、交互,根據(jù)客戶的需求生產(chǎn)產(chǎn)品;既是先有用戶再有產(chǎn)品。因此,理念的數(shù)據(jù)引起了研發(fā)模式的顛覆。
再如,“綠色”也是現(xiàn)代企業(yè)的一個重要的理念。“綠色”不光是指沒有污染,也指資源消耗少。雖然美國的用電很便宜,但DeepMind谷歌數(shù)據(jù)中心的耗電量很大。后來通過改進DeepMind把耗電降低了15%,且實現(xiàn)了設備投資的收回。事實上,他們通過數(shù)據(jù)中心幾千個傳感器去收集溫度、電量、耗電量等設備及建筑物的結(jié)構(gòu)(不同數(shù)據(jù)中心建筑物的結(jié)構(gòu)都不一樣)數(shù)據(jù),之后對數(shù)據(jù)進行深度學習等處理實現(xiàn)節(jié)能效果。顯然,該例中數(shù)據(jù)收集的標準即為節(jié)能的理念、綠色的理念。因此,類似這類問題是完全沒有固定模式的,我們不可能通過創(chuàng)建模型來解決。
這樣的技術(shù)也可以被用在其他方面。如減少半導體生產(chǎn),半導體耗水很厲害;幫助企業(yè)提高生產(chǎn)效率等。同樣我們國內(nèi)也有應用很好的例子,例如酒鋼鋼鐵企業(yè)為了節(jié)能減排,在高樓上面安裝了很多傳感器,效果非常好,平均提高勞動生產(chǎn)力5%,降低純鐵成本15元,預期在全行業(yè)推廣后,直接經(jīng)濟效益70億元/年。
接下來介紹數(shù)據(jù)的理念,首先數(shù)據(jù)里面實際上隱含著另外一種存在,以尿布和啤酒為例,雖然超市專家以前沒有意識到,但尿布和啤酒銷售存在關(guān)聯(lián)。我們很多觀點消失在人們的眼睛中,人們看不到,也淹沒在人們的模糊感覺中。
我們有時候可以在相似中發(fā)現(xiàn)一些顯著的差異,例如Lexus通過Twitter大數(shù)據(jù)分析,從倫敦奧運會冠軍中篩選廣告代言人。無論邀請姚明還是劉翔都具有相似性,他們都是體育明星,但他們還是有差異的,就需要通過數(shù)據(jù)去分析了解。另外,我們可以在巨大的差異之間發(fā)現(xiàn)相似的規(guī)律,例如,AlphaGo在所有的圍棋對局中,每一個人哪怕是同一個選手,每次對局都很不一樣,所以就要從很多的差異中尋找相似的規(guī)律,得到新的認識。
對于企業(yè)來說,以財務信息和業(yè)務信息的融合為例。實際上,很多企業(yè)的財務信息和業(yè)務信息并沒有很好地融合,就車間里一些具體設計業(yè)務的工藝來說,生產(chǎn)上方方面面的信息并沒有真正地被財務信息所利用,但實際上這個業(yè)務流程是和財務信息相關(guān)的。我們沒有精細的數(shù)據(jù)收集,所以傳統(tǒng)的信息和業(yè)務信息相互獨立。因此如何從大量的信息中進行挖掘,進行成本控制是非常有意義的工作。
其次,隱處的另外一種存在淹沒在人的自以為是中,AlphaGo這是臭棋,實際上AlphaGo對圍棋有新的認識,這是人類沒有認識到的。有的緊閉地存在深處,有超越人的智慧,特別的思維過程。所以我認為數(shù)據(jù)其實是“非人類思維”的種子。像AlphaGo有非人類的思維,人類以前沒意識到一樣,數(shù)據(jù)是“非人類思維”的種子,我們?nèi)绾螐臄?shù)據(jù)到信息,到智能,再到非人類思維。這對我們認識自動化是非常重要的。
我們要超越人的感知,例如,我?guī)讉€月前去臺灣一個很普通的大學參觀,其中的一個教授說:控制磨床進刀,老師傅通過聽模具的聲音可以判別出其質(zhì)量如何,或者應該如何去控制。然而,他們通過測量噪聲,噪聲要測量很容易,測量電流的變化,把數(shù)據(jù)收集起來和質(zhì)量等進行深度學習。結(jié)果顯示數(shù)據(jù)分析之后的磨床進刀控制要比人的感知好得多。
剛才所說的AlphaGo實際上就是非人類思維。最可怕的不是人類,是非人類思維。在很多情況下,計算機系統(tǒng),人工智能系統(tǒng)可能比我們的看法或感知更加細致入微。
以我的一個計算機繪畫作品為例,它實際上是根據(jù)我們拍的樹林的照片畫出的作品。我們?nèi)俗鳟嫷臅r候,有的地方透著光,有的地方有陰影;但計算機繪畫實際上是計算機對照片的分析,它更加的細致入微,用一種夸張的手法表現(xiàn)了出來。這說明了計算機或者人工智能系統(tǒng)比人的感知更加細致入微。
另外,關(guān)于數(shù)據(jù)的理念,我們需要重視數(shù)據(jù)收集常常需要跨系統(tǒng)、跨領(lǐng)域、跨媒體的,某一個問題的表征并不一定集中在某一個特定的系統(tǒng)數(shù)據(jù)之中。例如美國大選時特朗普當選很意外,美國主流媒體認為特朗普不可能當選。如果跨媒體收集數(shù)據(jù),絕對不會得出特朗普敗選的結(jié)論。因為人們只關(guān)注了主流媒體,沒有看民間媒體,所以才會感到意外。再如我們要判斷經(jīng)濟趨勢,判斷選民的意向,光看報紙是不行的,還需要我們?nèi)タ缦到y(tǒng),跨媒體了解相關(guān)信息。
我們車間的質(zhì)量問題不一定只和設備、工具、工人有關(guān)系,還會涉及到供應商、環(huán)境、氣候,甚至是某一特定的時期,社會上的特定活動等。就以正在舉行的世界杯為例,車間的質(zhì)量說不定與這些比賽有關(guān)??缑襟w也是一個很重要的方面,收集不同媒體的數(shù)據(jù),例如facebook,微信,中央電視臺等。這些媒體都傳遞了很多數(shù)據(jù),而且這些數(shù)據(jù)可以從一定的程度上反映經(jīng)濟問題,經(jīng)濟趨勢等。
之后,我們介紹數(shù)據(jù)的工作理念,在企業(yè)中,我們常說業(yè)務數(shù)據(jù)化、數(shù)據(jù)業(yè)務化。所謂業(yè)務數(shù)據(jù)化,即企業(yè)里每一項工作,每一個活動,每一項業(yè)務都要數(shù)據(jù)化。我們企業(yè)遠遠沒有達到業(yè)務數(shù)據(jù)化。所謂叫數(shù)據(jù)業(yè)務化,即指數(shù)據(jù)工作是由專門的業(yè)務部門來處理。目前政府部門已有專門的部門來處理數(shù)據(jù),如大數(shù)據(jù)局。但是在企業(yè)中,我們所有計算機中心或信息中心和數(shù)據(jù)中心是不同的。專門處理企業(yè)數(shù)據(jù)收集的范圍,數(shù)據(jù)傳送的標準等和數(shù)據(jù)相關(guān)的部門才是數(shù)據(jù)中心。
還有大家熟悉的數(shù)字雙胞胎的理念,在企業(yè)里現(xiàn)在非常強的。在企業(yè)中,數(shù)據(jù)驅(qū)動強調(diào)的是無數(shù)的流動。企業(yè)數(shù)據(jù)驅(qū)動包括在流水線上的。例如,德國巴斯夫企業(yè)生產(chǎn)的洗發(fā)水、液體肥皂是可以根據(jù)香味和顏色等喜好定制的,而且定制過程是根據(jù)記錄了數(shù)據(jù)的芯片實現(xiàn)的,體現(xiàn)了數(shù)據(jù)驅(qū)動。而雙胞胎強調(diào)的是數(shù)據(jù)從一個程序無縫流到另一個程序的過程。
最后,需要注意的是,不要指望一切都在預測和控制之中。近幾年有專家說:大數(shù)據(jù)、人工智能計劃經(jīng)濟成為可能,馬云也有這樣的觀點,認為什么都可以掌握,但我覺得這是不可能的。人是有自由意志的,你發(fā)布了什么計劃,你一定要我種花生,那我想種別的東西,假如說我是一個農(nóng)民的話,除非你規(guī)定任何你只能夠生產(chǎn)什么、工作什么,這個是不可能的事情。如果說你有一些預測,而我因為你的預測馬上做出改變。顯然,經(jīng)過改變,原來的東西實際上已經(jīng)發(fā)生了變化。因此,很多個體行為是無法預測的,但對一個群體來說,預測又是可能的,因為群體之內(nèi)的自由意志可能相互平衡抵消。但我們認為一切都在掌控之中、控制之中是不大可能的。
另外不能迷信數(shù)字與智能技術(shù),數(shù)字與智能技術(shù)依然存在漏洞。更復雜的社會,也意味著更復雜的糾錯機制、更高昂的糾錯成本。正如墨菲定律所說,“如果事情有變壞的可能,不管這種可能性有多小,它總會發(fā)生?!蔽蚁嘈胚@句話還是有一定道理的。
總之,數(shù)據(jù)驅(qū)動不是一切,大數(shù)據(jù)、人工智能開啟了認識整體聯(lián)系,認識不確定性,認識非固定模式等問題的大門。我們應該圍繞企業(yè)的理念和目標去收集、處理數(shù)據(jù)。嘗試去深刻地理解數(shù)據(jù)的一些基本理念等。