名家专栏

Famous column
首页 -名家专栏 -赵敏 -赵敏 | 释放工业互联网的数据潜能

赵敏 | 释放工业互联网的数据潜能

发布时间:2022-08-26作者来源:金航标浏览:1066


8月3日,“2022(第七届)大数据产业生态大会”在北京市海淀区辽宁大厦进行,应大会的邀请,走向智能研究院执行院长赵敏教授为大会做了题为《释放工业互联网的数据潜能》的主题报告。

[敏感词]是该报告的具体讲演内容(根据录音整理)。


微信图片_20220826113910.png

各位领导,各位来宾,大家上午好!
我给大家报告的题目是《释放工业互联网的数据潜能》,也正好是匹配我们今天的这个论坛的主题。首先,我向大家介绍一下对于工业互联网看法。

微信图片_20220826113914.png

关于工业互联网,很多人讲的时候,都是讲到了它的三大功能体系。主要是说:网络是基础,平台是核心,安全是保障。基本上所有的白皮书也都是这样写的。
但是,对于这个功能体系,我有一些不同的看法。因为这样的定义都是纯粹的ICT的定义,对吧?网络,ICT的,毫无疑问;然后平台,是咱们软件平台,ICT的;安全,是在说赛博安全、信息安全、网络安全,还是ICT的。
那么工业互联网,第一标签是工业,工业在哪里?——这是我一直质疑的一个问题。所以,我认为工业是主体,必须要首先澄清。而且,在工业是主体的这个前提下,我们再来谈网络,再来谈平台,再来谈安全,再来谈数据。这才是一个合乎实际情况的逻辑。
因此的话,我们在现在大家经常听到工业互联网的宣传当中,一直有这样一个悖论:网络、平台、安全、数据,但是不一定具有工业属性。而工业互联网又恰恰是为我们工业、为我们制造业提质增效的有效的手段,在我们百年交汇的这样一个新的时期下,中央高层高度重视的这样一个“新基建”的建设,,我们对工业互联网的宣传,对于其中的数据的认识,不能走偏了。这是我一直坚持的一个观点。

微信图片_20220826113917.png

对于工业互联网,有很多不同的看法,至少是两派不同的观点。
很多人认为,工业互联网是罩在工业实体上的一张电信网,这是最常见的观点;或者说,是互联网社交/消费互联网那一派宣传的,说“是互联网的下半场”,我都不知道这个“下半场”是怎么推出来的。工业互联网跟我们讲的社消互联网没有一毛钱关系,这个是必须搞清楚的事情。
所以,数据有没有工业的属性,反映不反映工业的实际情况,能不能真为工业业务环节来赋能,为我们的提质增效发挥真正实际作用,这不是只是奢谈数据所能达到的,也不是像某些厂商讲的:“把你的数据给我,我来给你赋能”,这样的活动没有一个是成功的,尽管过去几年,很多的企业都在用这样的方式来去做的。
我认为这种观点下的工业互联网是不接地气”的,他们是在平台、网络、安全这个层面的数据,跟工业少有交集。所以用这样的概念谈来谈去的话,是有很大的误解的。
其实应该是(图中)右边这个观点:工业互联网既不是工业的互联网,也不是互联网的工业,它是工业要素的联接,我反复写文章、写书说明这个观点,所以我再重复一遍:工业互联网不是工业的互联网,也不是互联网的工业,是工业要素联接的互联网络。因此的话,数据一定要具有工业属性,必须源于工业,用于工业,优于工业,而且要“接工业的底气”。

微信图片_20220826113921.png

在我所认知的工业互联网当中,它是一种我们新型的ICT要素和我们传统的工业要素之间的融合,而且并不是说,传统的工业要素它就不先进,一定要避免有这种误解。工业互联网的重点是联接并且服务于我们的工业实体,而且与工业实体融为一体。
可以用两个维度来衡量我们的工业实体,这是我在马上就要出版的一本新书,叫作《人本:从工业互联网走向数字文明》,在这本书当中描述的两个维度:一个维度是我们企业最常见的“人、机、料、法、环”,这是咱们很熟悉的观点,企业常见资源;另外一个维度,是现在都被忽略掉了的,企业之间的实体关系。所有的那些企业协作关系、企业实体关系、央企集团关系、乡土合作网,或者说原生的一些线下的这种关系网络,那么实际上它(指工互网)跟它(指实体关系网)的叠加和融合,才有利于工业互联网发展。这就是我们工业的基本盘——两个维度构成:一个是资源类的“人、机、料、法、环”,一个是企业之间的实体关系。
另外一个就是数据的工业属性,我认为工业现场的数据,必须而且一直与其所依附的工业端,发生着密不可分的高频互动,以复杂的各种数据种类,映射到更为复杂的工业现场关系的网络,这才是工业互联网当中的一个实质性的东西。
你听很多人谈的数据没有任何工业属性,除了讲“五个V”之外,我就不知道他们在谈什么。数据,必须按照工业互联网所映射的工业的现场关系,以及我们企业的资源“人、机、料、法、环”,对它们进行加载、穿透,对它进行映射,而且按照工业的模型、算法和机理来进行分析、推理,才能做出能够解决工业现场实际问题的决策和预测,就如同刚才杨部长讲的,“好的数据”是给企业去解决实际问题的数据,而不是就是光谈“一个数据”的数据。

微信图片_20220826113925.png

我给大家举一个例子。一个是大家熟知的,我用传感器去采集工业现场的数据,那就是高频的,比如说一个石化企业,它是流程制造业,通常的话会有5万到10万个数据采集点,大家注意,在一个央企的大型的石化企业当中,一般会有5万到10万的数据采集点。每一个数据采集点上的每一个传感器,就算1秒钟只采10个数据的话,那就是100万条,更何况实际采的数据量,可能还要相当大。这是我后面要谈到的,这些高频的、实时的数据,或者叫时序数据。
另外一个,我把它放到一个不是央企,不是大国企业,而是一个典型的中小微企业(场景),比如说被服厂。对于工业现场,我们怎么把人和机器的动作有序地拆解,形成我们的工业基础数据?这才是我们要研究的——我们要研究工业现场这种叫作“Ergonomics”,就是“人机工程学”,就是要研究人的每一个躯干肢体,它有什么样的“动素”,它能发生什么样的“基础动作”,这个“基础动作”会构成什么样的“生产动作”,这个“生产动作”再形成什么样的“标准工艺”,这个“标准工艺”我们再把它分成合理的步骤,排好我们的“标准工序”,最后这个“标准工序”再形成“工序线”,“工序线”再用我们的“产线”来实现,这才是从人和机器拆解,我们把它从工业现场提炼出来,它生成了我们最基础的工业数据,或者叫工艺数据。

微信图片_20220826113928.png

这种基础数据我们把它数字化,我们把它放到电脑里面去,因此它形成了比特化的基础数据,也就是说,我们数字化在数字化什么?数字化我们工业现场的所有的机器的动作、人的动作,所有的工艺步骤,这个时候才形成了我们一整套的这些所谓的DIKW——我在[敏感词]会去讲它的作用。
我们可以从顶层往下降维、解构数据,在软件里去查询;也可以在底层不断地向上升维、重构数据——重构是干什么?是经过计算、决策之后,以更好的方式来去生产,来去优化我们(拆解了人、机基础工艺数据)的工业现场。
大家可以看到,在这样一个DIKW体系当中,D就是Data,I就是Information, K是Knowledge,W是Wisdom——我们把它叫作“决策”或“预测”,这个是体现了我们的系统的一种智能(或者叫智慧)。
大家可以看到,工业现场的实体,我们把它用比特数据进行解构,这是真正的基于二进制的数字化,我们电脑的原理、软件的原理就是这么来的,因为从根本上来说,它们就是0和1。

微信图片_20220826113932.png

比特0和1,可以用ASCII编码表示任何的东西。一个8位是一个字节,两个8位或者说16位,或者说64位——64位就可以编码我们全世界任何一粒砂子,都可以编码进来。这就是刚才我们讲到的数据是什么?是用二进制表达的,一个8位、一个8位的这样的东西。
它可以是数字,数字没有任何意义,只能比较大小——我知道100比99大,2比3小,除此之外,没有任何意义,因为它没有时空背景。还有一些数据是单词类的,比如说只是一个“价格”,它叫“石油”,它叫“汽油”,或者这个叫“摄像机”,这些都是叫数据,都在电脑里。
但是当我把数据给它拼合起来,我再往上一层,它就变成了信息,为什么呢?“20”是一个数据,“元”是一个数据,“20元”就变成了“钱”,而不是20匹,20辆,20吨,所以数据就被赋予了时空意义,这就是信息。我们的工艺当中的任何一个动作,也就具有了时空意义。信息消除了数据的不确定性。
那么再往上,我还可以进行升维和重构,为什么呢?因为我们可以说:“我要买20吨汽油,该是多少钱”,这句话又变成了一条知识,对吧?我告诉你,要20吨油该是多少钱,对吧?因此的话,我们又把数字化的信息——这个information变成了知识,有了具体的语义。
而知识和知识的关联,就更不一样了。刚才杨部长谈到关联的问题,零散的数据、信息作用不大,甚至包括零散知识。但是当你把它们关联起来,作用就大了!刚才举的“天眼查”的例子,就是非常好的例子。对于我们来说,我们可以说每吨柴油多少钱,那么我们再判断,俄乌现在在打仗,那么再判断,油气价格在欧洲一定会涨,如果你做大宗货物,你正好面向欧洲做,那么你就可以事先囤一批货。所以,你利用已有的数据、信息、知识,最终构成了一个带有智能性或智慧性的这样一个预测和决策,那么我们才能够正确的去判断、去做事情,才能够去消除我们经常所面对的、这些外部世界的高度的不确定性。
因此这就是决策和预测所带来的价值,这也是我们基本的数字化、信息化的逻辑,也就是说,来源于工业现场、运行在软件之内、存储于电脑之中的、所有的不同的格式的那些数据,才是我们要谈的“数据”。

微信图片_20220826113936.png

因此,工业大数据搞了很多,广义上说,市场调研、需求分析、产品规划、工艺制定等等这一票,都叫数据,还有库存啊,等等。
在我们工业互联网当中,按照不同阶段,我们可以有在研品在制品在用品,有不同的数据;按照采样的频率,也有不同的数据;按照属性的划分,也有不同的数据,比如说实时数据、时序数据、标识数据等等——咱们部里面讲到这个工业互联网的标识,这也是一类数据。

微信图片_20220826113939.png

比如说,实时数据就必须是实时采的,实时来用,它才有作用。一旦过去了,它就没有什么用了。但是,这些数据如果把它留存下来,它有明确的时空背景,消除了里面的噪声和垃圾数据的话,那么它对于未来的分析是有意义的。但是还必须要完整的、从哪产生的,有那个时空背景。
时序数据是带有时间戳的数据,一定是带有时间戳的,要分得清楚先后,一旦分不清楚先后,这些数据就全部都是垃圾,没有任何意义。

微信图片_20220826113942.png

所以我们一定要强调一点:这个数据来源一定是“时空背景+业务逻辑”。

数据不会凭空来,也不会悄然遁去。数据的产生要有明确的工业现场的时空背景,是真实的我们的“人、机、料、法、环”等工作信息的映射。所以我们在工业实体上的上下游企业,他们之间的合作,我们把这个需求,因为需求是刚性的,我下了订单,你接了订单,就要按合同、按照契约精神给我来做这个订单。订单一步一步分解到企业里面,就会变成不同的内部业务环节和流程。我们就会去备料,我们就会准备工艺,我们就会启动机器,一步一步去做出产品。

所以,我们所有的数据的来源和业务需求必须要匹配,才能产生合乎逻辑的结果。这是我们要说的,离开了业务需求、工业现场的时空背景,去讨论数据,是不科学的,不正确的,也是荒谬的。

微信图片_20220826113947.png

那么,数据怎样炼?

我们一定要知道:在企业当中的数据,是我们业务场景呈现的状态变量;在软件中的数据是模型、算法所支配客体对象;在机器当中,数据是驱动设备、控制它去精准运转的指令。因此,数据的属性和功能,它往往是非常多元化的。

所以,说数据是新型生产要素,一点没有问题。数据可以通过软件赋能而迸发出巨大的生产力。但是数据本身它不是生产力。这个概念我们就是予以澄清。

原料级的数据一定要经过处理才能够使用,就像刚才我说的,从“动素”一直到“产线”的这样一个拆解,我们把这些数据都提炼出来,但是这是原始工艺数据,它要数字化之后,进到我们的信息系统,进到我们的数字化系统当中去算,按照最优的那些模型和算法——软件里面全部都是算法,合乎工业逻辑的基本模型和算法,让它去算。

把软件作为“磨(魔)盘”,把原料级的数据进行各种颗粒度的精细加工,不断地识别、接收、计算、解读、打磨、重构,最后再生成符合我们业务需求的精品数据,再用软件作为“增压泵”,用网络作为“管道”,把精品级的数据,给它“泵”回到你所需要的地方,就是刚才我画的那张图中的生产现场,它要回到我们的业务环节当中去,重新放大、赋能、解构、重构我们的业务,让它产生最好的一个软件赋能的效果、数据赋能的效果。

微信图片_20220826113951.png

因此,我们数据有这么两手硬的功能:第一,用来显示,在大屏幕上、各种屏幕上显示我们的计算结果;第二,按照人预先设计的这个自主决策,数据直接进到我们的设备当中,就是我不显示而直接去驱动(设备)。

所以第一种形式,是第三次工业革命的结果;第二种形式,是第四次工业革命结果。大家今天看到的自动驾驶汽车就是这种方式,数字指令自动就可以去驱动机器。

数据源于工业时空,优于赛博时空,回归工业时空,一去一来,算力提速,模型精炼,算法优化,数据焕新,数据映射的那些企业资源,都在软件的算法的巧妙安排下得到最优配置。

微信图片_20220826113954.png

因此,我认为,数据它确实是可以为我们企业释放出巨大的能量。

但是还要注意,数据到底是“姓公”还是“姓私”?所有的企业都不愿意把数据分享出来,因为这属于“我的(数据)”,是私有性但是,数据也有具有无损拷贝的这种属性,那么一旦出了企业的范围,它就是失控。

数据还具有“公有性”,就是说你一定要在一定范围之内来流动,不流动的数据是没有价值的。只有流动的数据,被软件充分解构、重构的数据,才具有这种流动价值。

微信图片_20220826113957.png

因此,我们怎么能够去消除这种矛盾?那就一定要让数据流动起来。流速如果越快,流动越顺畅,分享的范围越大,流动频次越高,它产生的价值就越大。这个是数据给我们的赋能。

尽管我们不能把所有数据变成是公有的,但是工业互联网一定有这个职能,要把一部分私有性的数据转换成公有性的数据。否则,我们为什么要建工业互联网的大数据中心?我们回答不了这个问题。

微信图片_20220826114001.png

数据本身具有两面性,既可以载舟,也可以覆舟,如果模型和算法有问题,在算力加持下,高速流动和分析的数据,由于软件千百倍地放大,会让错误的结果随之放大,造成大范围的业务损失。

微信图片_20220826114006.png

所以我们要注意:工业是主体,核心是数据,关键是软件。

工业互联网天然具有工业属性。这就是我们所谈到的,具有工业属性的数据,必须在一定范围之内流动、交易,才有可能演变成动态价值流,形成数字生产力,为企业产生巨大价值。为数字经济做出应有的贡献。

好,我就讲到这,谢谢大家!

微信图片_20220826114009.png

8月4日(今天),“2022(第七届)大数据产业生态大会”还有一整天会期,有众多内容丰富的专业报告,值得大家在线下、线上观看和分享。详细会议内容请在下图中扫二维码观看。

微信图片_20220826114015.jpg