趙敏
關于工業互聯網,很多人都會講到它的三大功能體系:網絡是基礎,平臺是核心,安全是保障。這些都是純粹的ICT(信息通信技術)定義,但是,對于這個功能體系,我有一些不同的看法。
工業互聯網,第一標簽是“工業”,“工業”在哪里?這是我一直疑惑的問題。所以,必須首先澄清“工業是主體”,工業互聯網是工業、制造業提質增效的有效手段,以此為前提,我們再來談網絡,談平臺,談安全,談數據,這才是一個合乎實際情況的邏輯。近兩年來,我國高度重視“新基建”建設,因此,我們對工業互聯網的宣傳不能走偏了。
澄清定義——
工業要素聯接的互聯網絡
對于工業互聯網,至少有兩派不同的觀點。第一種,認為工業互聯網是罩在工業實體上的一張電信網,這是最常見的觀點;第二種,認為“是互聯網的下半場”。工業互聯網跟我們講的社交/消費互聯網沒有任何關系,這是必須搞清楚的。所以,數據有沒有工業屬性,能否反映工業的實際情況,能否真正為工業業務環節賦能,在提質增效上發揮實際作用等,這些不是只奢談數據就能達到的。這種觀點下的工業互聯網“不接地氣”,是在平臺、網絡、安全層面的數據,跟工業少有交集。
我認為,工業互聯網不是工業的互聯網,也不是互聯網的工業,它是工業要素聯接的互聯網絡。因此,數據必須源于工業,用于工業,優于工業,而且要“接工業的地氣”,實現新型的ICT要素和傳統工業要素之間的融合。
工業互聯網的重點是聯接并且服務于我們的工業實體,與工業實體融為一體。可以用兩個維度來衡量我們的工業實體:一個維度是我們企業最常見的資源類“人、機、料、法、環”,另一個維度是現在常被忽略的企業之間的實體關系。所有企業協作關系、企業實體關系、央企集團關系、鄉土合作網或者原生的線下關系網絡,實際是工業互聯網和實體關系網的疊加和融合,只有這樣才有利于工業互聯網的發展。
另外,我認為工業現場的數據,必須與其所依附的工業端保持著密不可分的高頻互動,將復雜的數據種類映射到更為復雜的工業現場關系網絡中,這才是工業互聯網當中一個實質性的東西。數據必須對工業互聯網所映射的工業現場關系,以及企業資源類“人、機、料、法、環”進行加載、穿透、映射,而且按照工業的模型、算法和機理對其進行分析、推理,才能做出解決工業現場實際問題的決策和預測,即“好的數據”是能為企業解決實際問題的數據。
框定來源——
“時空背景+業務邏輯”
數據是怎么來的?舉個例子。比如用傳感器采集工業現場的數據,采集的就是高頻的數據。一個大型的石化央企,一般會有5萬個~10萬個數據采集點,每個數據采集點有個傳感器,即使1秒鐘只采10個數據也有50萬條~100萬條數據。這就是時序數據。假如在一個典型的中小微企業場景,如何把人和機器的動作有序拆解,形成工業基礎數據,才是我們要研究的“人機工程學”。其實就是要研究人的每一個軀干肢體有什么樣的“動素”,能發生什么樣的“基礎動作”,這個“基礎動作”會構成什么樣的“生產動作”,這個“生產動作”再形成什么樣的“標準工藝”,我們再把“標準工藝”分成合理的步驟,排好“標準工序”、形成“工序線”,最后用“產線”來實現。這樣就生成最基礎的工業數據或者工藝數據。
把這種基礎數據數字化,就形成了比特化的基礎數據。數字化就是把我們工業現場所有機器和人的動作、所有的工藝步驟數字化,從而形成一整套的DIKW體系(數據、信息、知識及決策體系)。我們可以從頂層往下降維、解構數據,在軟件里去查詢;也可以從底層不斷地向上升維、重構數據。
如何重構?重構是經過計算、決策之后,以更好的方式去生產和優化工業現場。這樣一個DIKW體系體現了系統的智能屬性。我們用比特數據對工業現場的實體進行解構,這是真正基于二進制的數字化,從根本上來說就是0和1。
數據是什么?就是用二進制表達的,一個又一個8位的東西。它可以是數字,也可以是單詞類的,比如“價格”“石油”。但是當往上一層,把數據拼合起來、賦予數據時空意義后就變成了信息,消除了數據的不確定性。我們生產工藝當中的任何一個動作也就具有了時空意義。再往上,還可以進行升維和重構。其實,零散的數據、信息作用不大,甚至包括零散的知識。舉例來說,首先知道每噸柴油多少錢,接著再判斷俄烏沖突正在繼續,油氣價格在歐洲一定會漲,如果正好面向歐洲做大宗貨物貿易,就可以事先囤一批貨。所以,利用已有的數據、信息、知識,最終構成一個帶有智慧性的預測和決策,我們才能消除外部世界的高度不確定性,做正確的事情。也就是說,來源于工業現場、運行在軟件之內、存儲于電腦之中,最終能夠形成有效決策的所有不同格式數據,才是我們要談的“數據”。
在工業互聯網當中,按照不同階段,有在研品、在制品、在用品等數據;按照采樣的頻率,可以有不同的數據;按照屬性的劃分,也可以有實時數據、時序數據、標識數據等。如果把實時數據留存下來,消除了里面的噪聲和垃圾數據的話,對未來的分析是有意義的,但必須有完整的時空背景。
所以,我們一定要強調:數據來源一定是“時空背景+業務邏輯”。數據不會憑空來,也不會悄然遁去。數據的產生要有明確的時空背景,是真實的“人、機、料、法、環”等工作信息的映射。所以,離開了業務需求、工業現場的時空背景去討論數據,是不科學的、不正確的,也是荒謬的。
釋放潛能——
工業數據流動方能產生價值
數據怎樣提煉并應用?我們一定要知道:企業當中的數據是我們業務場景呈現的狀態變量;軟件中的數據是模型、算法所支配的客體對象;機器當中的數據是驅動設備、控制它去精準運轉的指令。因此,數據的屬性和功能往往是非常多元化的,說數據是新型生產要素也沒有任何問題。
不過,數據雖然可以通過軟件賦能而迸發出巨大的生產力,但數據本身不是生產力。這個概念我們要予以澄清。
原料級的數據一定要經過處理才能使用。我們要把這些數據提煉并數字化之后輸入信息系統,在數字化系統當中按照最優的模型和算法計算。把軟件作為“磨盤”,把原料級的數據進行各種顆粒度的精細加工,不斷地識別、接收、計算、解讀、打磨、重構,最后生成符合我們業務需求的精品數據,再用軟件作為“增壓泵”,用網絡作為“管道”,把精品級的數據“泵”回到需要的地方,即要回到我們的業務環節當中去,重新放大、賦能、解構、重構我們的業務,讓它產生最好的軟件賦能、數據賦能效果。
因此,數據有這么兩手硬的功能:第一,用來顯示,在各種屏幕上顯示我們的計算結果;第二,不顯示而直接去驅動(設備),即按照人的預先設計進行自主決策,讓數據直接進到設備當中。可以說,第一種形式是第三次工業革命的結果,第二種形式是第四次工業革命的結果。大家今天看到的自動駕駛汽車就是這種方式,數字指令可以自動驅動機器。
數據源于工業時空,優于賽博時空,回歸工業時空。一去一來,算力提速,模型精煉,算法優化,數據煥新。數據映射的那些企業資源,都在軟件、算法的“巧妙安排”下得到最優配置。因此,我認為,數據確實可以為企業釋放出巨大的能量。
還要注意,數據到底是“姓公”還是“姓私”?所有的企業都不愿意把數據分享出來,這是私有性。但是,數據也有具有無損拷貝的屬性,那么一旦出了企業的范圍,它就會失控。數據還具有“公有性”,不流動的數據是沒有價值的。而只有被軟件充分解構、重構的數據,才具有這種流動價值。如何消除這種矛盾?一定要讓數據流動起來。流速越快、流動越順暢,分享的范圍就越大,流動頻次就越高,它產生的價值就越大。這是數據給我們的賦能。盡管我們不能把所有數據變成公有,但工業互聯網一定有這個職能。否則,我們為什么要建工業互聯網的大數據中心?
數據本身具有兩面性,既可以載舟,也可以覆舟。如果模型和算法有問題,在算力加持下,高速流動和經過分析的數據,會讓錯誤的結果隨之放大,造成大范圍的業務損失。所以我們要注意:工業是主體,核心是數據,關鍵是軟件。具有工業屬性的數據,必須在一定范圍之內流動、交易,才有可能演變成動態價值流,形成數字生產力,為企業產生巨大價值,為數字經濟做出應有的貢獻。
(作者系走向智能研究院執行院長)
《中國冶金報》(2022年08月16日 03版三版)