系统架构师-第11章未来信息综合技术

第11章未来信息综合技术

未来信息综合技术是指近年来新技术发展而提出的一些新概念、新知识、新产品,本章将综合概述这些新技术的相关知识、定义和应用。本章主要包括信息物理系统 (CPS)、人工智能 (AI)、机器人、边缘计算、数字孪生、云计算和大数据等技术。这些技术涉及多学科、多领域,具有很强的技术综合性,但是,其核心是计算机信息技术的延伸,也是当前应用技术发展的前沿。

11.1 信息物理系统技术概述

11.1.1 信息物理系统的概念

1.信息物理系统的来源

信息物理系统 (Cyber-Physical Systems,CPS) 这一术语,最早由美国国家航空航天局于 1992 年提出,到 2006 年,美国国家科学基金会科学家海伦·吉尔在国际上第一个关于信息物理系统的研讨会上将这一概念进行了详细描述。

信息物理系统是控制系统、嵌入式系统的扩展与延伸,其涉及的相关底层理论技术源于对嵌入式技术的应用与提升。然而,随着信息化和工业化的深度融合发展,传统嵌入式系统中解决物理系统相关问题所采用的单点解决方案已不能适应新一代生产装备信息化和网络化的需求,急需对计算、感知、通信、控制等技术进行更为深度的融合。因此,在云计算、新型传感、通信、智能控制等新一代信息技术的迅速发展与推动下,信息物理系统顺势出现。

2.CPS 的本质和定义

CPS 是多领域、跨学科不同技术融合发展的结果。CPS 已经引起了国内外的广泛关注。通过对现有各国科研机构及学者的观点进行系统全面研究综合得出 CPS 的定义,即:CPS 通过集成先进的感知、计算、通信、控制等信息技术和自动控制技术,构建了物理空间与信息空间中人、机、物、环境、信息等要素相互映射、适时交互、高效协同的复杂系统,实现系统内资源配置和运行的按需响应、快速迭代、动态优化。

基于硬件、软件、网络、工业云等一系列工业和信息技术构建起的智能系统其最终目的是实现资源优化配置。实现这一目标的关键要靠数据的自动流动,在流动过程中数据经过不同的环节,在不同的环节以不同的形态 (隐性数据、显性数据、信息、知识) 展示出来,在形态不断变化的过程中逐渐向外部环境释放蕴藏在其背后的价值,为物理空间实体"赋予"实现一定范围内资源优化的"能力"。因此,CPS 的本质就是构建一套信息空间与物理空间之间基于数据自动流动的状态感知、实时分析、科学决策、精准执行的闭环赋能体系,解决生产制造、应用服务过程中的复杂性和不确定性问题,提高资源配置效率,实现资源优化。

11.1.2 CPS 的实现

1.CPS 的体系架构

基于对 CPS 的认识,本节描述一个 CPS 最小单元体系架构,即单元级 CPS 体系架构,然后逐级扩展出系统级和 SoS 级两个层级的体系架构。

1)单元级

单元级 CPS 是具有不可分割性的 CPS 最小单元,其本质是通过软件对物理实体及环境进行状态感知、计算分析,并最终控制到物理实体,构建最基本的数据自动流动的闭环,形成物理世界和信息世界的融合交互。同时,为了与外界进行交互,单元级 CPS 应具有通信功能。单元级 CPS 是具备可感知、可计算、可交互、可延展、自决策功能的 CPS 最小单元,一个智能部件、一个工业机器人或一个智能机床都可能是一个 CPS 最小单元。

2)系统级

在实际运行中,任何活动都是多个人、机、物共同参与完成的。例如,在制造业中,实际生产过程中的冲压可能是有传送带进行传送,工业机器人进行调整,然后由冲压机床进行冲压,这是多个智能产品共同活动的结果,这些智能产品组合在一起就形成了一个系统。

多个最小单元 (单元级) 通过工业网络 (如工业现场总线、工业以太网等),实现更大范围、更宽领域的数据自动流动,实现了多个单元级 CPS 的互联、互通和互操作,进一步提高制造资源优化配置的广度、深度和精度。系统级 CPS 基于多个单元级 CPS 的状态感知、信息交互、实时分析,实现了局部制造资源的自组织、自配置、自决策、自优化。在单元级 CPS 功能的基础上,系统级 CPS 还主要包含互联互通、即插即用、边缘网关、数据互操作、协同控制、监视与诊断等功能。其中互连互通、边缘网关和数据互操作主要实现单元级 CPS 的异构集成;即插即用主要在系统级 CPS 实现组件管理,包括组 (单元级 CPS) 的识别,配置,更新和删除等功能;协同控制是指对多个单元级 CPS 的联动和协同控制等;监视与诊断主要是对单元级 CPS 的状态实时监控和诊断其是否具备应有的能力。

3)SoS 级

多个系统级 CPS 的有机组合构成 SoS 级 CPS。例如,多个工序 (系统的 CPS) 形成一个车间级的 CPS 或者形成整个工厂的 CPS。

SoS 级 CPS 主要实现数据的汇聚,从而对内进行资产的优化和对外形成运营优化服务。其主要功能包括:数据存储、数据融合、分布式计算、大数据分析、数据服务,并在数据服务的基础上形成了资产性能管理和运营优化服务。

SoS 级 CPS 可以通过大数据平台,实现跨系统、跨平台的互联、互通和互操作,促成了多源异构数据的集成、交换和共享的闭环自动流动,在全局范围内实现信息全面感知、深度分析、科学决策和精准执行。这些数据部分存储在 CPS 智能服务平台,部分分散在各组成的组件内。对于这些数据进行统一管理和融合,并具有对这些数据的分布式计算和大数据分析能力,是这些数据能够提供数据服务,有效支撑高级应用的基础。

2.CPS 的技术体系

CPS 技术体系主要分为 CPS 总体技术、CPS 支撑技术、CPS 核心技术。CPS 总体技术主要包括系统架构、异构系统集成、安全技术、试验验证技术等,是 CPS 的顶层设计技术;CPS 支撑技术主要包括智能感知、嵌入式软件、数据库、人机交互、中间件、SDN (软件定义网络)、物联网、大数据等,是基于 CPS 应用的支撑;CPS 核心技术主要包括虚实融合控制、智能装备、MBD、数字孪生技术、现场总线、工业以太网、CAX\MES\ERP\PLM\CRM\SCM 等,是 CPS 的基础技术。

上述技术体系可以分为四大核心技术要素即"一硬" (感知和自动控制)、“一软” (工业软件)、“一网” (工业网络)、“一平台” (工业云和智能服务平台)。其中感知和自动控制是 CPS 实现的硬件支撑;工业软件固化了 CPS 计算和数据流程的规则,是 CPS 的核心;工业网络是互联互通和数据传输的网络载体;工业云和智能服务平台是 CPS 数据汇聚和支撑上层解决方案的基础,对外提供资源管控和能力服务。

1)感知和自动控制

  1. 智能感知技术。

    CPS 系统主要使用的智能感知技术是传感器技术。传感器是一种检测装置,能感受到被测量的信息,并能将检测感受到的信息,按一定规律变换成为电信号或其他所需形式的信息输出,以满足信息的传输、处理、存储、显示、记录和控制等要求。

  2. 虚实融合控制技术。

    CPS 虚实融合控制是多层"感知-分析-决策-执行"循环,建立在状态感知的基础上,感知往往是实时进行的,向更高层次同步或即时反馈。包括嵌入控制、虚体控制、集控控制和目标控制四个层次。其中嵌入控制主要针对物理实体进行控制、虚体控制是指在信息空间进行的控制计算,主要针对信息虚体进行控制、集控控制是指在信息空间内,主要通过 CPS 总线的方式进行信息虚体的集成和控制、目标控制是指在实际生产的测量结果或追溯信息收集到产品数据过程中,通过即时比对判断来生产是否达成目标。

2)工业软件

工业软件是指专用于工业领域,为提高工业企业研发、制造、生产、服务与管理水平以及工业产品使用价值的软件。工业软件通过应用集成能够使机械化、电气化、自动化的生产系统具备数字化、网络化、智能化特征,从而为工业领域提供一个面向产品生命周期的网络化、协同化、开放式的产品设计、制造和服务环境。

3)工业网络

CPS 中的工业网络技术是基于分布式的全新范式,由于各种智能设备的引入,设备可以相互连接从而形成一个网络服务。每一个层面,都拥有更多的嵌入式智能和响应式控制的预测分析;每一个层面,都可以使用虚拟化控制和工程功能的云计算技术。与传统工业控制系统严格的基于分层的结构不同,高层次的 CPS 是由低层次 CPS 互连集成,灵活组合而成。

4)工业云和智能服务平台

工业云和智能服务平台通过边缘计算、雾计算、大数据分析等技术进行数据的加工处理,形成对外提供数据服务的能力,并在数据服务基础上提供个性化和专业化智能服务。

11.1.3 信息物理系统的建设和应用

1.CPS 应用场景概览

目前,CPS 受到工业领域的广泛关注,并已在多个环节得到应用和体现。通过对目前 CPS 在工业领域中的应用程度、重要性、代表性进行筛选和考量,本文选择从智能设计、智能生产、智能服务、智能应用这四个方面,结合 CPS 的关键特征和关键技术实现对 CPS 的应用场景进行阐述和说明。

2.CPS 典型应用场景

1)智能设计

随着 CPS 的成熟,在产品及工艺设计、工厂设计过程中的大部分工作都可以在虚拟空间中进行仿真,并实现迭代和改进。通过基于仿真模型的"预演",可以及早发现设计中的问题,减少或避免实际生产中的问题,从而缩短产品设计到生产的周期,并提高产品的可靠性。

  1. 产品及工艺设计。

    在例如机械产品包括结构强度、热力学等仿真设计中,CPS 能够避免传统系统各自独立的问题,在仿真过程中完整模拟产品的综合应用环境,从而实现更全面、真实的产品工况仿真,同时通过数据驱动形成产品优化设计方案,实现产品设计与产品使用的高度协同。在产品工艺设计方面,为了使产品的制造工艺设计更加精准、高效,需要对实际制造工艺的具体参数进行采集,例如机加工中刀具的切削参数、电机功率参数等。软件系统将工艺信息进行处理。将实时采集的工艺数据进行仿真,并以已有的工艺方案作为支撑,形成制造工艺优化方案。

  2. 生产线/工厂设计。

    在生产线/工厂设计方面,综合考虑生产线/工厂中不同设备、不同系统之间的集成,根据生产线/工厂建设的现有条件下采集到的数据来分析计算出合理的设备布局、人员布局、工装工具物料布局、车间运输布局,建立生产线/工厂生产仿真模型,依据仿真结果优化生产线/工厂的设计方案。

2)智能生产

生产制造是制造企业运营过程中非常重要的活动,CPS 可以打破生产过程的信息孤岛现象,实现设备的互联互通,实现生产过程监控,合理管理和调度各种生产资源,优化生产计划,达到资源和制造协同,实现"制造"到"智造"的升级。

  1. 设备管理应用场景。

    CPS 可以将各个系统或终端连接成一个智能网络,构建形成设备网络平台。实现了人、设备、服务之间互联互通,使数据和信息能够通畅流转,具备了对设备的实时监控。进而对工序设备进行实时优化控制,使各种组成单元能够根据工作任务需要自行集结成一种超柔性组织结构,并最大限度地利用各类信息资源。

  2. 生产管理应用场景。

    在生产管理过程中通过 CPS 对生产过程的实时数据信息进行实时处理分析,实现对生产制造环节的智能决策,从资源管理、生产计划与调度来对整个生产制造进行管理、控制以及科学决策,使整个生产环节的资源处于有序可控的状态。

  3. 柔性制造应用场景。

    CPS 的数据驱动和异构集成特点为应对生产现场的快速变化提供了可能,而柔性制造的要求就是能够根据快速变化的需求变更生产,因此,CPS 契合了柔性制造的要求,为企业柔性制造提供了很好的实施方案。

3)智能服务

通过 CPS 按照需要形成本地与远程云服务相互协作、个体与群体、群体与系统的相互协同一体化工业云服务体系,能够更好地服务于生产,解决装备运行日益复杂、使用难度日益增大的困扰,实现智能装备的协同优化,支持企业用户经济性、安全性和高效性经营目标落地。

  1. 健康管理。

    将 CPS 与装备管理相结合,实时应用健康评估模型对装备进行分析预演及评估,将运行决策和维护建议反馈到控制系统,为装备最优使用和及时维护提供自主认知、学习、记忆、重构的能力,实现装备健康管理。

  2. 智能维护。

    应用仿真测试等技术,基于装备虚拟健康的预测性智能维护模型,构建装备智能维护 CPS 系统。通过采集装备的实时运行数据,进行装备性能、安全、状态等特性分析,预测装备可能出现的状态,进而提前对异常状态采取预测性维护。

  3. 远程征兆性诊断。

    在 CPS 应用场景下,当装备发生故障时,远程专家可以调取装备的报警信息、日志文件等数据,在虚拟的设备健康诊断模型中进行预演推测,实现远程的故障诊断并及时、快速地解决故障,从而减少停机时间并降低维修成本。

  4. 协同优化。

    以飞机运营为例,运营中对乘客人数、飞行时间、环境数据、机场数据等数据的采集,同步共享给相关方:飞机设计与制造部门通过飞机虚拟模拟模型推演出最优方案指导飞机操作人员、航空运营商和地勤运营等。

  5. 共享服务。

    CPS 将单一智能装备的信息进行共享,于是智能装备可以利用自身的感知和运算能力帮助其他智能装备进行分析运算,智能装备可依据云端群体知识进行活动优化。

4)智能应用

工业产品不同于大众消费品,可以将企业用户作为生产工具纳入再生产体系当中,创造服务、获取利润。通过上述"新四基"的建设,将设计者、生产者和使用者的单调角色转变为新价值创造的参与者,并通过新型价值链的创建反馈到产业链的转型,从根本上调动各个参与者构,并最大限度地利用各类信息资源。

  1. 生产管理应用场景。

    在生产管理过程中通过 CPS 对生产过程的实时数据信息进行实时处理分析,实现对生产制造环节的智能决策,从资源管理、生产计划与调度来对整个生产制造进行管理、控制以及科学决策,使整个生产环节的资源处于有序可控的状态。

  2. 柔性制造应用场景。

    CPS 的数据驱动和异构集成特点为应对生产现场的快速变化提供了可能,而柔性制造的要求就是能够根据快速变化的需求变更生产,因此,CPS 契合了柔性制造的要求,为企业柔性制造提供了很好的实施方案。

3)智能服务

通过 CPS 按照需要形成本地与远程云服务相互协作、个体与群体、群体与系统的相互协同一体化工业云服务体系,能够更好地服务于生产,解决装备运行日益复杂、使用难度日益增大的困扰,实现智能装备的协同优化,支持企业用户经济性、安全性和高效性经营目标落地。

  1. 健康管理。

    将 CPS 与装备管理相结合,实时应用健康评估模型对装备进行分析预演及评估,将运行决策和维护建议反馈到控制系统,为装备最优使用和及时维护提供自主认知、学习、记忆、重构的能力,实现装备健康管理。

  2. 智能维护。

    应用仿真测试等技术,基于装备虚拟健康的预测性智能维护模型,构建装备智能维护 CPS 系统。通过采集装备的实时运行数据,进行装备性能、安全、状态等特性分析,预测装备可能出现的状态,进而提前对异常状态采取预测性维护。

  3. 远程征兆性诊断。

    在 CPS 应用场景下,当装备发生故障时,远程专家可以调取装备的报警信息、日志文件等数据,在虚拟的设备健康诊断模型中进行预演推测,实现远程的故障诊断并及时、快速地解决故障,从而减少停机时间并降低维修成本。

  4. 协同优化。

    以飞机运营为例,运营中对乘客人数、飞行时间、环境数据、机场数据等数据的采集,同步共享给相关方:飞机设计与制造部门通过飞机虚拟模拟模型推演出最优方案指导飞机操作人员、航空运营商和地勤运营等。

  5. 共享服务。

    CPS 将单一智能装备的信息进行共享,于是智能装备可以利用自身的感知和运算能力帮助其他智能装备进行分析运算,智能装备可依据云端群体知识进行活动优化。

4)智能应用

工业产品不同于大众消费品,可以将企业用户作为生产工具纳入再生产体系当中,创造服务、获取利润。通过上述"新四基"的建设,将设计者、生产者和使用者的单调角色转变为新价值创造的参与者,并通过新型价值链的创建反馈到产业链的转型,从根本上调动各个参与者的积极性,实现制造业转型。

  1. 无人装备。

    建立在"新四基"之上的 CPS 可以应用于装备智能化的问题。通过数据学习认知装备操控过程知识,并通过行为认知迭代增强决策正确率,逐渐实现物的智慧代替人的智慧,建立无人智能设备。同时在同类型的装备上进行模型移植,实现设备智能化能力的低成本快速推进。

  2. 产业链互动。

    在市场需求饱和时,设计者、生产者可以利用工业网络,构建信息空间,通过机器学习等手段,分析产品的使用状况,预测用户需求和市场趋势,提供设计修改建议,智能优化配置资源。同时,通过 CPS 让用户参与到产品的设计生产过程中,激发用户的需求,增加购买欲望,共同实现敏捷设计和柔性生产。

  3. 价值链共赢。

    制造企业要实现向服务商的转型,由单一的依靠销售产品收入变为通过交付后的产品服务实现长期稳定的收入。可以通过 CPS 建立人、装备和环境在信息空间中的映射,以较低成本向用户提供定制化服务。通过服务,进一步参与到产品交付后的持续盈利过程中,在分担用户管理使用风险的同时实现共赢。

3.CPS 建设路径

CPS 在状态感知、实时分析、科学决策、精准执行的数据闭环下,可以实现生产制造的自主协调、智能优化和持续创新,对于企业制造的各个环节都可以得到很大的提升。但是企业在建设 CPS 的过程中要充分考虑 CPS 的层级特征,根据实际情况采取不同的应对措施。CPS 的建设不可能一蹴而就,一定是循序渐进、逐渐深入的,其建设路径可以分为如下几个阶段:CPS 体系设计、单元级 CPS 建设、系统级 CPS 建设和 SoS 级 CPS 建设阶段。

其中在建设 CPS 的初期,应该从行业背景出发,结合自身特点,针对应用模式、层次架构、安全体系、标准规范体系等方面开展 CPS 建设相关的整体体系设计。当企业处于单元级 CPS 建设阶段,首先应明确单元级 CPS 的建设目标,即通过物理硬件、嵌入式软件及通信模块构成含有"感知-分析-决策执行"数据自由流动的闭环,实现资源的优化配置。在具体建设上应将感控设备安装、制造工艺与流程数字化作为重点。当企业处于系统级 CPS 建设阶段,需要实现更大范围、更宽领域的数据自由流动,更多关注多个单元级 CPS 之间的互联互通、协同控制。在具体建设上应将工业网络的建设作为重点。当企业处于 SoS 级 CPS 建设阶段,要实现多个系统级 CPS 的有机组合,更多关注于数据存储和分布式处理能力、智能服务能力,在具体建设上应将大数据平台、智能服务平台的建设作为重点。

11.2 人工智能技术概述

11.2.1 人工智能的概念

人工智能 (Artificial Intelligence,AI) 是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能的目标是了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。该领域的研究包括机器人、自然语言处理、计算机视觉和专家系统等。

根据人工智能是否能真正实现推理、思考和解决问题,可以将人工智能分为弱人工智能和强人工智能。

1.弱人工智能

弱人工智能是指不能真正实现推理和解决问题的智能机器,这些机器表面看像是智能的,但是并不真正拥有智能,也不会有自主意识。迄今为止的人工智能系统都还是实现特定功能的专用智能,而不是像人类智能那样能够不断适应复杂的新环境并不断涌现出新的功能,因此都还是弱人工智能。目前的主流研究仍然集中于弱人工智能,并取得了显著进步,如在语音识别、图像处理和物体分割、机器翻译等方面都取得了重大突破,某些方面甚至可以接近或超越人类水平。

2.强人工智能

强人工智能是指真正能思维的智能机器,并且认为这样的机器是有知觉的和有自我意识的,这类机器可分为类人 (机器的思考和推理类似人的思维) 与非类人 (机器产生了和人完全不一样的知觉和意识,使用和人完全不一样的推理方式) 两大类。从一般意义来说,达到人类水平的、能够自适应地应对外界环境挑战的、具有自我意识的人工智能称为"通用人工智能"“强人工智能"或"类人智能”。强人工智能在技术上的研究具有极大的挑战性,当前鲜有进展,美国私营部门的专家及国家科技委员会认为,强人工智能至少在未来几十年内难以实现。

11.2.2 人工智能的发展历程

长期以来,制造具有智能的机器一直是人类的梦想。早在 1950 年,艾伦·图灵 (Alan Turing) 在《计算机与智能》中就阐述了对人工智能的思考,提出了著名的图灵测试:如果一台机器能够与人类展开对话 (通过电传设备) 而不能被辨别出其机器身份,那么称这台机器具有智能。同时图灵还预言了存在真正具备智能机器的可行性。

1956 年夏季,马文·明斯基 (Marvin Lee Minsky) 与约翰·麦卡锡 (John MeCarthy) 等人在达特茅斯学院 (Dartmouth College) 举办了一个人工智能夏季研讨会,会上正式使用了"人工智能"这一术语,标志着人工智能研究领域的诞生。1959 年,阿瑟·塞缪尔 (Arthur Samuel) 提出了机器学习,将传统的制造智能演化为通过学习能力来获取智能,推动人工智能进入了第一次繁荣期。1968 年,爱德华·费根鲍姆 (Edward Feigenbaum) 提出首个专家系统 DENDRAL,并对知识库给出了初步的定义,实现了人工智能从理论研究走向实际应用的重大突破,将人工智能的研究推向了新高潮。

20 世纪 70 年代,由于计算机的运算能力不足,以当时计算机有限的内存和处理速度不足以解决任何实际的 AI 问题。计算复杂性呈指数增长,许多问题只可能在指数时间内获解,AI 中的许多算法难以发展为实用的系统。重要的 AI 应用的程序需要知道它在看什么或者在说些什么,这就要求程序对这个世界具有一定的认识水平,而在当时没人能够做出如此巨大的数据库,也没人知道一个程序怎样才能学到如此丰富的信息。这一时期,人工智能的研究者们遭遇了无法克服的基础性障碍,人工智能的发展进入"寒冬"。

20 世纪 80 年代初,人工智能因专家系统的商业成功而复兴,进入了第二次浪潮。其标志事件是 1980 年汉斯·贝利纳 (Hans Berliner) 打造的计算机战胜双陆棋世界冠军。随后,基于行为的机器人学在罗德尼·布鲁克斯 (Rodney Brooks) 和萨顿 (R.Sutton) 等人的推动下快速发展,格瑞·特索罗 (Gerry Tesauro) 等人打造的自我学习双陆棋程序为后来增强学习的发展奠定了基础。

20 世纪 80 年代中期,随着美国、日本立项支持人工智能研究以及以知识工程为主导的机器学习方法的发展,出现了具有更强可视化效果的决策树模型和突破早期感知局限的多层人工神经网络,由此带来了人工智能的又一次繁荣期。然而,当时的计算机难以模拟复杂度高、规模大的神经网络,仍有一定的局限性。1987 年由于 LISP 机市场崩塌,美国取消了人工智能预算,日本第五代计算机项目失败并退出市场,专家系统进展缓慢,人工智能又进入了萧瑟期。

20 世纪 90 年代末,人工智能技术开始进入平稳发展时期。1997 年,IBM 深蓝 (Deep Blue) 战胜国际象棋世界冠军加里·卡斯帕罗夫 (Garry Kasparov)。这是一次具有里程碑意义的成功,代表了基于规则的人工智能的胜利。2006 年,在杰弗里·辛顿 (Geoffrey Hinton) 和他的学生的推动下,深度学习开始备受关注,为人工智能的发展带来了重大影响。

从 2010 年开始,人工智能进入爆炸式发展阶段,得益于大数据时代的到来,运算能力及算法得到提高,许多先进的机器学习技术得到了成功应用,产业界开始不断涌现出新的研发成果:2011 年,IBM 的问答系统 Waston 在综艺节目《危险边缘》中战胜了最高奖金得主和连胜纪录保持者;2012 年,Google Brain 通过模仿人类大脑在没有人类指导的情况下,利用非监督深度学习方法从大量视频中成功学习到识别出一只猫的能力;2014 年,Microsoft 公司推出了一款实时口译系统,可以模仿说话者的声音并保留其口音;2014 年,Microsoft 公司发布全球第一款个人智能助理 Microsoft Cortana;2014 年,Amazon 发布智能音箱产品 Echo 和个人助手 Alexa;2016 年,Google Alpha Go 机器人在围棋比赛中击败了世界冠军李世石。

人工智能,未来已来。2020 年,在全球抗击疫情的背景下,人工智能被赋予了更多期待和重任,它在信息收集、数据汇总及实时更新、流行病调查、疫苗药物研发、新型基础设施建设等领域大显身手。随着新技术新业态的不断涌现,人工智能凝聚全球智慧、助力全球经济复苏的力量更加凸显,人工智能在我们的生活中无处不在。

11.2.3 人工智能关键技术

1.自然语言处理 (Natural Language Processing,NLP)

自然语言处理是计算机科学与语言学的交叉学科,也是人工智能的重要方向,研究实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及的领域主要包括机器翻译 (利用计算机实现从一种自然语言到另外一种自然语言的翻译)、语义理解 (利用计算机理解文本篇章内容,并回答相关问题) 和问答系统 (让计算机像人类一样用自然语言与人交流) 等。

2.计算机视觉 (Computer Vision)

计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力,将图像分析任务分解为便于管理的小块任务。自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近年来随着深度学习的发展,预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能算法技术。

3.知识图谱 (Knowledge Graph)

知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系。知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从"关系"的角度去分析问题的能力。知识图谱可用于反欺诈、不一致性验证、组团欺诈等对公共安全保障形成威胁的领域,需要用到异常分析、静态分析、动态分析等数据挖掘方法。知识图谱在搜索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。

4.人机交互 (Human-Computer Interaction,HCl)

人机交互主要研究人和计算机之间的信息交换,包括人到计算机和计算机到人的两部分信息交换,是人工智能领域的重要的外围技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科的交叉。传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互及脑机交互等技术。

5.虚拟现实或增强现实 (Virtual Reality /Augmented Reality,VR/AR)

虚拟现实或增强现实是以计算机为核心的新型视听技术。结合相关科学技术,在一定范围内生成与真实环境在视觉、听觉等方面高度近似的数字化环境。用户借助必要的装备与数字化环境中的对象进行交互,相互影响,获得近似真实环境的感受和体验,通过显示设备、跟踪定位设备、触力觉交互设备、数据获取设备、专用芯片等实现。

6.机器学习

机器学习 (Machine Learning,ML) 是人工智能的核心研究领域之一,是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科。其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。具体来说,机器学习是以数据为基础,通过研究样本数据寻找规律,并根据所得规律对未来数据进行预测。目前,机器学习广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别等领域。

1)机器学习定义

广义上来说,机器学习指专门研究计算机怎么模拟或实现人类的学习行为以获取新的知识或技能的学科,使计算机重新组织已有的组织结构并不断改善自身的性能。更加精确地说,一个机器学习的程序就是可以从经验数据 E 中对任务 T 进行学习的算法,它在任务 T 上的性能度量 P 会随着对于经验数据 E 的学习而变得更好。

2)机器学习分类

首先,按照学习模式的不同,机器学习可分为监督学习、无监督学习、半监督学习、强化学习。其中,监督学习需要提供标注的样本集,无监督学习不需要提供标注的样本集,半监督学习需要提供少量标注的样本,而强化学习需要反馈机制。

  1. 监督学习。

    监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,从而实现对新数据/实例的标记 (分类)/映射。监督学习要求训练样本的分类标签已知,分类标签的精确度越高,样本越具有代表性,学习模型的准确度越高。目前,监督学习在自然语言处理、信息检索、文本挖掘、手写体辨识、垃圾邮件侦测等领域获得了广泛应用。最典型的监督学习算法包括回归和分类等。

  2. 无监督学习。

    无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律。无监督学习不需要以人工标注数据作为训练样本,这样不仅便于压缩数据存储、减少计算量、提升算法速度,还可以避免正负样本偏移引起的分类错误问题。无监督学习主要用于经济预测、异常检测、数据挖掘、图像处理、模式识别等领域,例如组织大型计算机集群、社交网络分析、市场分割、天文数据分析等。无监督学习常见算法包括 Apriori 算法、KMeans 算法、随机森林、主成分分析等。

  3. 半监督学习。

    半监督学习介于监督学习与无监督学习之间,可以利用少量的标注样本和大量的未标识样本进行训练和分类,从而达到减少标注代价、提高学习能力的目的。半监督学习的应用场景包括分类和回归,算法包括一些常用监督学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。例如,图论推理算法或者拉普拉斯支持向量机等。

  4. 强化学习。

    强化学习可以学习从环境状态到行为的映射,使得智能体选择的行为能够获得环境的最大奖赏,最终目标是使外部环境对学习系统在某种意义下的评价最佳。由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。目前,强化学习在机器人控制、无人驾驶、工业控制等领域获得成功应用。强化学习的常见算法包括 Q-Leamning、时间差学习等。

其次,按照学习方法的不同,机器学习可分为传统机器学习和深度学习。区别在于,传统机器学习的领域特征需要手动完成,且需要大量领域专业知识;深度学习不需要人工特征提取,但需要大量的训练数据集以及强大的 GPU 服务器来提供算力。

  1. 传统机器学习。

    传统机器学习从一些观测 (训练) 样本出发,试图发现不能通过原理分析获得的规律,实现对未来数据行为或趋势的准确预测。传统机器学习的相关算法包括逻辑回归、隐马尔科夫方法、支持向量机方法、K 近邻方法、三层人工神经网络方法、Adaboost 算法、贝叶斯方法以及决策树方法等。传统机器学习平衡了学习结果的有效性与学习模型的可解释性,为解决有限样本的学习问题提供了一种框架。传统机器学习方法在自然语言处理、语音识别、图像识别、信息检索等许多计算机领域获得了广泛应用。

  2. 深度学习。

    深度学习是一种基于多层神经网络并以海量数据作为输入规则的自学习方法,依靠提供给它的大量实际行为数据 (训练数据集),进行参数和规则调整。深度学习算法网络的隐藏层数量多,算法复杂,相比传统机器学习,深度学习更注重特征学习的重要性。典型的深度学习算法包括卷积神经网络 (CNN)循环神经网络 (RNN) 等。

最后,机器学习的常见算法还包括迁移学习、主动学习和演化学习。

  1. 迁移学习。

    迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,利用另一领域数据获得的关系进行的学习。迁移学习可以把已训练好的模型参数迁移到新的模型指导新模型训练,更有效的学习底层规则、减少数据量。目前的迁移学习技术主要在变量有限的小规模应用中使用,如基于传感器网络的定位、文字分类和图像分类等。未来迁移学习将被广泛应用于解决更有挑战性的问题,如视频分类、社交网络分析、逻辑推理等。

  2. 主动学习。

    主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记,然后用查询到的样本训练分类模型来提高模型的精度。主动学习能够选择性地获取知识,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性准则和差异性准则选取有效的样本。

  3. 演化学习。

    演化学习基于演化算法提供的优化工具设计机器学习算法,针对机器学习任务中存在大量的复杂优化问题,应用于分类、聚类、规则发现、特征选择等机器学习与数据挖掘问题中。演化算法通常维护一个解的集合,并通过启发式算子来从现有的解产生新解,并通过挑选更好的解进入下一次循环,不断提高解的质量。演化算法包括粒子群优化算法、多目标演化算法等。

3)机器学习综合应用

如今,机器学习已经"无处不在",应用遍及人工智能的各个领域,包括数据挖掘、计算机视觉、自然语言处理、语音和手写识别、生物特征识别、搜索引擎、医学诊断、信用卡欺诈检测、证券市场分析、汽车自动驾驶、军事决策等。举例如下:

互联网广告是互联网公司主要的盈利手段,互联网广告交易的双方是广告主和媒体。广告主为自己的产品投放广告并为广告付费。媒体提供广告的展示平台,并收取广告费,比如各大门户网站、各种论坛。

广告点击率是指广告的点击到达率。在实际应用中,从海量的广告历史点击日志中提取训练样本,构建特征并训练广告点击率模型,评估各方面因素对点击率的影响。

当有新的广告请求到达时,就可以使用训练好的模型,根据广告交易平台传过来的相关特征去预估这次展示中各个广告的点击概率,结合广告出价来计算广告点击收益,从而选出收益最高的广告向广告交易平台付费。

4)机器学习的未来

机器学习虽然取得了长足的进步,也解决了很多实际问题,但是客观地讲,机器学习领域仍然存在着巨大的挑战。

首先,主流的机器学习技术是黑箱技术,因此就无法预知暗藏的危机,为解决这个问题,需要让机器学习具有可解释性、可干预性。其次,目前主流的机器学习的计算成本很高,亟待发明轻量级的机器学习算法。另外,在物理、化学、生物、社会科学中,人们常常用一些简单而美的方程 (比如像薛定谔方程这样的二阶偏微分方程) 来描述表象背后的深刻规律。那么在机器学习领域也试图能追求到简单而美的规律。

如此的挑战还有很多,但是由于机器学习领域具有巨大的研究和应用潜能,研究者们对于这个领域未来的发展仍然充满信心。

11.3 机器人技术概述

11.3.1 机器人的概念

机器人的英文名词是 Robot,Robot 一词最早出现在 1920 年捷克作家卡雷尔·卡佩克 (Karel Capek) 所写的剧本中,剧中的人造劳动者取名为 Robot,捷克语的意思是"苦力"“奴隶”。英语的 Robot 一词就是由此而来的,以后世界各国都用 Robot 作为机器人的代名词。

机器人问世已有几十年,机器人的定义仍没有一个统一的意见,原因之一是机器人还在发展。新的机型、新的功能不断涌现。同时由于机器人涉及人的概念,因此成为一个难以回答的哲学问题。

11.3.2 机器人的定义和发展历程

1967 年日本召开的第一届机器人学术会议上,人们提出了两个具有代表性的定义。一是森政弘与合田周平提出的:“机器人是一种具有移动性、个体性、智能性、通用性、半机械半人性、自动性、奴隶性等 7 个特征的柔性机器。“从这一定义出发,森政弘又提出了用自动性、智能性、个体性、半机械半人性、作业性、通用性、信息性、柔性、有限性、移动性等 10 个特性来表示机器人的形象;另一个是加藤一郎提出的,具有如下 3 个条件的机器可以称为机器人:

  1. 具有脑、手、脚等三要素的个体;
  2. 具有非接触传感器 (用眼、耳接收远方信息) 和接触传感器;
  3. 具有平衡觉和固有觉的传感器。

该定义强调了机器人应当具有仿人的特点,即它靠手进行作业,靠脚实现移动,由脑来完成统一指挥的任务。非接触传感器和接触传感器相当于人的五官,使机器人能够识别外界环境,而平衡觉和固有觉则是机器人感知本身状态所不可缺少的传感器。

机器人的发展过程可以简单地分为 3 个阶段:

  1. 第一代机器人:示教再现型机器人。1947 年,为了搬运和处理核燃料,美国橡树岭国家实验室研发了世界上第一台遥控的机器人。1962 年美国又研制成功 PUMA 通用示教再现型机器人,这种机器人通过一个计算机,来控制一个多自由度的机械,通过示教存储程序和信息,工作时把信息读取出来,然后发出指令,这样的机器人可以重复地根据人当时示教的结果,再现出这种动作。比方说汽车的点焊机器人,它只要把这个点焊的过程学会以后,它总是重复这样一种工作。
  2. 第二代机器人:感觉型机器人。示教再现型机器人对于外界的环境没有感知,这个操作力的大小,这个工件存在不存在,焊接的好与坏,它并不知道,因此,在 20 世纪 70 年代后期,人们开始研究第二代机器人,叫感觉型机器人,这种机器人拥有类似人在某种功能的感觉,如力觉、触觉、滑觉、视觉、听觉等,它能够通过感觉来感受和识别工件的形状、大小、颜色。
  3. 第三代机器人:智能型机器人。20 世纪 90 年代以来发明的机器人。这种机器人带有多种传感器,可以进行复杂的逻辑推理、判断及决策,在变化的内部状态与外部环境中,自主决定自身的行为。

关于机器人的分类,国际上没有制定统一的标准,可以从机器人的操控方式、应用环境、功能用途和作业空间等不同方面进行划分,从不同的角度可以有不同的分类。

经历了几十年的发展,机器人技术已经形成了一门新的综合性学科——机器人学 (Robotics)。机器人学包括有基础研究和应用研究两个方面,主要的研究内容包括:

  • 机械手设计;
  • 机器人运动学、动力学和控制;
  • 轨迹设计和路径规划;
  • 传感器;
  • 机器人视觉;
  • 机器人语言;
  • 装置与系统结构;
  • 机器人智能等。

如今,随着电子技术和计算机技术的飞速发展,机器人技术已经准备进入 4.0 时代。所谓机器人 4.0 时代,就是把云端大脑分布在各个地方,充分利用边缘计算的优势,提供高性价比的服务,把要完成任务的记忆场景的知识和常识很好地组合起来,实现规模化部署。特别强调机器人除了具有感知能力实现智能协作,还应该具有一定的理解和决策能力,进行更加自主的服务。

我们目前的服务机器人大多可以做到物体识别和人脸识别。在机器人 4.0 时代,我们需要加上更强的自适应能力。我们目前在使用深度学习进行物体识别或人脸识别需要大量数据的来源,但是真正到了日常生活的场景中,我们很难拥有这么多的数据,这就需要机器人可以通过少量的数据来建立识别能力,自己从不同的位置和角度进行训练。

11.3.3 机器人 4.0 的核心技术

机器人 4.0 主要有以下几个核心技术:包括云-边-端的无缝协同计算、持续学习与协同学习、知识图谱、场景自适应和数据安全。

1.云-边-端的无缝协同计算

由于目前网络带宽和延迟的制约,当前机器人主要采用以机器人本身进行运算为主,云端处理非实时、大计算量的任务为辅的系统架构。机器人的主要任务也可以简单地划分为感知,推理和执行三个步骤。随着 5G 时代的来临和边缘计算的部署,机器人到基站的延迟会大大降低。同时,边缘服务器可以在网络的边缘来处理机器人的数据,大大减少云端处理数据的压力,形成一个高效的数据处理架构。云-边-端一体的机器人系统是面向大规模机器人的服务平台,信息处理和生成主要在云-边-端上分布处理完成。通常情况下,云侧可以提供高性能的计算和知识存储,边缘侧用来进一步处理数据并实现协同和共享。机器人端只用完成实时操作的功能。由于目前对于机器人的需求日益增加,机器人 4.0 系统还要实现动态的任务迁移机制,可以合理地将任务迁移到云-边-端,实现云-边-端的协同计算。

2.持续学习与协同学习

持续学习与协同学习在机器人 4.0 时代也十分重要。在之前的机器人学习过程中,我们主要采用的方法是基于大量数据进行的监督学习方法。但是在机器人 4.0 时代,我们需要加上持续学习与协同学习的能力,使我们的机器人可以适应更加复杂的环境。具体来说,我们希望机器人可以通过少量数据来建立基本的识别能力,然后可以自主地去找到更多的相关数据并进行自动标注。然后用这些自主得到的数据来对自己已有的模型进行重新训练来提高性能。随着这个过程的不断推移,我们可以把机器人的性能逐步提高。但是在实际的应用中,由于接触数据不一定会非常广泛,我们机器人学习的速度可能会受到很大的限制。所以我们同时也要采用大数据和云端的处理能力,让各种机器人之间的数据进行共享,保证机器人持续学习与协同学习的能力。进一步提高机器人学习的速度与精度。

3.知识图谱

目前在互联网和语音助手已经有了十分广泛的应用。但是不同于通常的百科类知识图谱,机器人应用的知识图谱应该具有一些不同的需求:

  1. 需要更加动态和个性化的知识。机器人在与人交互的同时,往往需要根据当前的环境来深入理解,从而提供更好的服务。因此,机器人必须具有记录不同时间不同环境发生的事件以及对应的信息,这些都是知识图谱不能提供的,必须从环境中获取。如果可以收集这些环境信息,机器人就可以提供更加个性化的服务。
  2. 知识图谱需要和机器人的感知与决策能力相结合,帮助机器人实现更高级的持续学习能力。从人工智能的发展来看,单一的算法并不能完全解决现有的 AI 问题,未来的发展一定是设计多种方法结合的 AI 系统。不同于以往的知识图谱独立运作的做法,知识图谱以后必须和感知决策更深入、有机的结合。具体来说,知识图谱可以从感知中获取信息,通过基础的感知加上场景理解,将获得的知识存入图谱,然后使用这部分信息可以进一步进行模式的挖掘 (比如时间空间相关的模式) 来获得更深层次的信息。知识图谱的知识也可以作为环境上下文信息提供给感知算法进行学习,从而实现自适应的感知算法。

由于云-边-端融合的需要,知识图谱分别存在于机器人侧,云侧和边缘侧。由于协同学习与实时处理的需求,知识以及其他相关信息 (数据或者模型) 也可以通过云侧、边缘侧进行分享。在未来的 5G 网络下,延迟已经不存在问题,我们更应该考虑充分利用边缘端和机器人端的计算能力,达到资源的最优利用。

4.场景自适应

主要通过对当前场景进行三维语义理解的基础上,主动观察场景内人和物之间的变化,预测可能发生的事件,从而影响之后的行动模式。这个技术的关键问题在于场景预测能力。场景预测就是机器人通过对场景内的各种人和物进行细致的观察,结合相关的知识和模型进行分析,并预测之后事件即将发生的时间,改变自己的行为模式。这部分的研究目前还属于比较初级的阶段,但是相信以后在持续学习、知识图谱等技术充分结合的基础上,这个方向未来会有更大的突破。使机器人实现感知-认知-行动,变得更加智能化和人性化。同时,云端融合在这里也会起到非常重要的作用,主要是在知识的共享方面,有可能单个机器人很难去根据当前场景来预测即将发生的情况,但是通过云-边-端融合,只要有一个机器人见过这种情况的发生,它就会将当时的数据保存到云端,进而分享给所有的机器人,其他机器人就可以来预测未来可能发生的这些危险情况。除了通过实际的物理世界进行观察以外,在云端通过大规模的模拟来预演可能发生的情况,可能也是另外一个获得更多的事件模式的有效方法。

5.数据安全

由于机器人配备了各种各样的传感器,在工作的过程中,会收集到很多信息,包括视觉数据、位置数据、语音数据等,这些重要的数据都需要得到保护。在机器人处于云-边-端融合的环境下,网络有可能会受到攻击,保护用户的数据安全变得尤其重要。云-边-端融合的机器人系统需要完整的数据安全保障机制,既要保证端到端的安全传输,也要保障服务器端的安全存储。只有确保了数据的输入输出都是安全的情况下,才能保证机器人的物理安全逻辑得到正确执行。除了保证原始的隐私数据外,通过用户数据推理得出的个性化数据包含了用户的隐私信息,同样也需要得到安全的保障。在云-边-端融合的环境下,机器人侧,云侧,边缘侧的数据安全需求也是不同的。因此需要不同的安全保障机制。在机器人本体方面需要重要的隐私数据的物理安全以及安全相关应用的代码安全。云侧和边缘侧需要对用户本身的数据以及推理得到的用户数据中的隐私信息做好保护,只有被授权的用户才有访问权。尽量避免敏感数据上传到云端,存储在云端的数据需要提供安全存储鉴别机制。

11.3.4 机器人的分类

由于机器人的用途广泛,有许多种分类。行业不同,机器人的应用场景不一样,由于要求的不同,机器人的控制方式也存在许多差异,这里简要描述两种分类。

如果按照要求的控制方式分类,机器人可分为操作机器人、程序机器人、示教再现机器人、智能机器人和综合机器人。

1.操作机器人

操作机器人的典型代表是在核电站处理放射性物质时远距离进行操作的机器人。在这种机器人中,具有人手操纵功能的部分称为主动机械手,进行类似于动作的部分称为从动机械手。其中从动机械手要大些,是用经过放大的力进行作业的机器人;主动机械手要小些。还有既可以用显微镜进行观察,又可以进行精密作业的机器人。

2.程序机器人

程序机器人可以按预先给定的程序、条件、位置进行作业。

3.示教再现机器人

示教再现机器人与盒式磁带的录放相似,机器人可以将所教的操作过程自动地记录在磁盘、磁带等存储器中,当需要再现操作时,可重复所教过的动作过程。示教方法有直接示教与遥控示教两种。

4.智能机器人

智能机器人既可以进行预先设定的动作,还可以按照工作环境的改变而变换动作。

5.综合机器人

综合机器人是由操纵机器人、示教再现机器人、智能机器人组合而成的机器人,如火星机器人。1997 年 7 月 4 日,“火星探路者” (Mars Pathfinder) 在火星上着陆,着陆体是四面体形状,在能上下左右动作的摄像机平台上有两台 CCD 摄像机,通过立体观测而得到空间信息。整个系统可以看作是由地面指令操纵的操作机器人。

如果按照应用行业来分,机器人可分为工业机器人、服务机器人和特殊领域机器人。

1.工业机器人

工业机器人包括搬运、焊接、装配、喷漆、检查等机器人,主要应用于现代化的工厂和柔性加工系统中。

2.服务机器人

比如娱乐机器人包括弹奏乐器的机器人、舞蹈机器人、玩具机器人等 (具有某种程度的通用性),也包括根据环境而改变动作的机器人。

3.特殊领域机器人

主要包括建筑、农业等机器人,主要应用于人们难以进入的核电站、海底、宇宙空间等场合。

11.4 边缘计算概述

11.4.1 边缘计算概念

在介绍边缘计算之前,就有必要先介绍一下章鱼。章鱼就是用"边缘计算"来解决实际问题的。作为无脊椎动物中智商最高的一种动物,章鱼拥有巨量的神经元,但 60% 分布在章鱼的八条腿 (腕足) 上,脑部仅有 40%。也就是说章鱼是用"腿"来解决问题的。

类比于边缘计算,边缘计算将数据的处理、应用程序的运行甚至一些功能服务的实现,由网络中心下放到网络边缘的节点上。在网络边缘侧的智能网关上就近采集并且处理数据,不需要将大量未处理的原生数据上传到远处的大数据平台。

如果能像章鱼一样,采用边缘计算的方式,海量数据则能够就近处理,大量的设备也能实现高效协同的工作,诸多问题迎刃而解。因此,边缘计算理论上可满足许多行业在敏捷性、实时性、数据优化、应用智能,以及安全与隐私保护等方面的关键需求。

未来边缘计算市场空间广阔。据 IDC 预测,2020 年将有超过 500 亿的终端与设备联网,而有 50% 的物联网将面临网络带宽的限制,40% 的数据需要在网络边缘分析、处理与储存。边缘计算市场规模将超万亿,将成为与云计算平分秋色的新兴市场。边缘计算的广阔市场空间将为整个产业界带来无限的想象空间和崭新的发展机遇。

11.4.2 边缘计算的定义

1.边缘计算产业联盟 (ECC) 对于边缘计算的定义

边缘计算的业务本质是云计算在数据中心之外汇聚节点的延伸和演进,主要包括云边缘、边缘云和云化网关三类落地形态;以"边云协同"和"边缘智能"为核心能力发展方向;软件平台需要考虑导入云理念、云架构、云技术,提供端到端实时、协同式智能、可信赖、可动态重置等能力;硬件平台需要考虑异构计算能力,如鲲鹏、ARM、X86、GPU、NPU、FPGA 等。

  1. 云边缘:云边缘形态的边缘计算,是云服务在边缘侧的延伸,逻辑上仍是云服务,主要的能力提供依赖于云服务或需要与云服务紧密协同。如华为云提供的 IEF 解决方案,阿里云提供的 Link Edge 解决方案,AWS 提供的 Greengrass 解决方案等均属于此类。
  2. 边缘云:边缘云形态的边缘计算,是在边缘侧构建中小规模云服务能力,边缘服务能力主要由边缘云提供;集中式 DC 侧的云服务主要提供边缘云的管理调度能力。如多接入边缘计算 (MEC)、CDN、华为云提供的 IEC 解决方案等均属于此类。
  3. 云化网关:云化网关形态的边缘计算,以云化技术与能力重构原有嵌入式网关系统,云化网关在边缘侧提供协议/接口转换、边缘计算等能力,部署在云侧的控制器提供边缘节点的资源调度、应用管理与业务编排等能力。

2.OpenStack 社区的定义概念

“边缘计算是为应用开发者和服务提供商在网络的边缘侧提供云服务和 IT 环境服务;目标是在靠近数据输入或用户的地方提供计算、存储和网络带宽。” OpenStack 社区是一个由 NASA 和 Rackspace 合作研发并发起的。

3.ISO/IEC JTC1/SC38 对边缘计算给出的定义

边缘计算是一种将主要处理和数据存储放在网络的边缘节点的分布式计算形式。边缘计算产业联盟对边缘计算的定义是指在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷连接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。

4.国际标准组织的定义

ETSI (European Telecommunications Standards Institute,欧洲电信标准协会) 提供了移动网络边缘 IT 服务环境和计算能力,强调靠近移动用户,以减少网络操作和服务交付的时延,提高用户体验。

11.4.3 边缘计算的特点

边缘计算是在靠近物或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的分布式开放平台 (架构),就近提供边缘智能服务,满足行业数字化在敏捷联接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。它可以作为联接物理和数字世界的桥梁,使能智能资产、智能网关、智能系统和智能服务。

边缘计算具有以下特点:

  1. 联接性:联接性是边缘计算的基础。所联接物理对象的多样性及应用场景的多样性,需要边缘计算具备丰富的联接功能,如各种网络接口、网络协议、网络拓扑、网络部署与配置、网络管理与维护。联接性需要充分借鉴吸收网络领域先进研究成果,如 TSN、SDN、NFV、Network as a Service、WLAN、NB-loT、5G 等,同时还要考虑与现有各种工业总线的互联互通。
  2. 数据第一入口:边缘计算作为物理世界到数字世界的桥梁,是数据的第一入口,拥有大量、实时、完整的数据,可基于数据全生命周期进行管理与价值创造,将更好的支撑预测性维护、资产效率与管理等创新应用;同时,作为数据第一入口,边缘计算也面临数据实时性、确定性、多样性等挑战。
  3. 约束性:边缘计算产品需适配工业现场相对恶劣的工作条件与运行环境,如防电磁、防尘、防爆、抗振动、抗电流/电压波动等。在工业互联场景下,对边缘计算设备的功耗、成本、空间也有较高的要求。边缘计算产品需要考虑通过软硬件集成与优化,以适配各种条件约束,支撑行业数字化多样性场景。
  4. 分布性:边缘计算实际部署天然具备分布式特征。这要求边缘计算支持分布式计算与存储、实现分布式资源的动态调度与统一管理、支撑分布式智能、具备分布式安全等能力。

11.4.4 边云协同

边缘计算与云计算各有所长,云计算擅长全局性、非实时、长周期的大数据处理与分析,能够在长周期维护、业务决策支撑等领域发挥优势;边缘计算更适用局部性、实时、短周期数据的处理与分析,能更好地支撑本地业务的实时智能化决策与执行。因此边缘计算与云计算之间不是替代关系,而是互补协同关系,边云协同将放大边缘计算与云计算的应用价值:边缘计算既靠近执行单元,更是云端所需高价值数据的采集和初步处理单元,可以更好地支撑云端应用;反之,云计算通过大数据分析优化输出的业务规则或模型可以下发到边缘侧,边缘计算基于新的业务规则或模型运行。边缘计算不是单一的部件,也不是单一的层次,而是涉及 EC IaaS、EC-PaaS、EC-SaaS 的端到端开放平台。因此边云协同的能力与内涵涉及 IaaS、PaaS、SaaS 各层面的全面协同,主要包括六种协同:资源协同、数据协同、智能协同、应用管理协同、业务管理协同、服务协同。

  1. 资源协同:边缘节点提供计算、存储、网络、虚拟化等基础设施资源、具有本地资源调度管理能力,同时可与云端协同,接受并执行云端资源调度管理策略,包括边缘节点的设备管理、资源管理以及网络连接管理。
  2. 数据协同:边缘节点主要负责现场/终端数据的采集,按照规则或数据模型对数据进行初步处理与分析,并将处理结果以及相关数据上传给云端;云端提供海量数据的存储、分析与价值挖掘。边缘与云的数据协同,支持数据在边缘与云之间可控有序流动,形成完整的数据流转路径,高效低成本对数据进行生命周期管理与价值挖掘。
  3. 智能协同:边缘节点按照 AI 模型执行推理,实现分布式智能;云端开展 AI 的集中式模型训练,并将模型下发边缘节点。
  4. 应用管理协同:边缘节点提供应用部署与运行环境,并对本节点多个应用的生命周期进行管理调度;云端主要提供应用开发、测试环境,以及应用的生命周期管理能力。
  5. 业务管理协同:边缘节点提供模块化、微服务化的应用/数字孪生/网络等应用实例;云端主要提供按照客户需求实现应用/数字孪生/网络等的业务编排能力。
  6. 服务协同:边缘节点按照云端策略实现部分 EC SaaS 服务,通过 EC SaaS 与云端 SaaS 的协同实现面向客户的按需 SaaS 服务;云端主要提供 SaaS 服务在云端和边缘节点的服务分布策略,以及云端承担的 SaaS 服务能力。

11.4.5 边缘计算的安全

边缘计算的 CROSS (Connectivity、Realtime、data Optimization、Smart、Security) 价值推动计算模型从集中式的云计算走向更加分布式的边缘计算,为传统的网络架构带来了极大的改变,这些改变促进了技术和业务的发展,同时也将网络攻击威胁引入了网络边缘。以工业场景为例,根据《中国工业互联网安全态势报告》,截至 2018 年 11 月,全球范围内暴露在互联网上的工控系统及设备数量已超 10 万台。边缘安全是边缘计算的重要保障。边缘安全涉及跨越云计算和边缘计算纵深的安全防护体系,增强边缘基础设施、网络、应用、数据识别和抵抗各种安全威胁的能力,为边缘计算的发展构建安全可信环境,加速并保障边缘计算产业发展。边缘安全的价值体现在下述几方面:

提供可信的基础设施:主要包括了计算、网络、存储类的物理资源和虚拟资源。基础设施是包含路径、数据交互和处理模型的平台面,应对镜像篡改、DDoS 攻击、非授权通信访问、端口入侵等安全威胁。

为边缘应用提供可信赖的安全服务:从运行维护角度,提供应用监控、应用审计、访问控制等安全服务;从数据安全角度,提供轻量级数据加密、数据安全存储、敏感数据处理与监测的安全服务,进一步保证应用业务的数据安全。

保障安全的设备接入和协议转换:边缘计算节点数量庞大,面向工业行业存在中心云、边缘云、边缘网关、边缘控制器等多种终端和边缘计算形态,复杂性异构性突出。保证安全的接入和协议转换,有助于为数据提供存储安全、共享安全、计算安全、传播和管控以及隐私保护。

提供安全可信的网络及覆盖:安全可信的网络除了传统的运营商网络安全保障 (如:鉴权、密钥、合法监听、防火墙技术) 以外,目前面向特定行业的 TSN、工业专网等,也需要定制化的网络安全防护。提供端到端全覆盖的包括威胁监测、态势感知、安全管理编排、安全事件应急响应、柔性防护在内的全网安全运营防护体系。

11.4.6 边缘计算应用场合

1.智慧园区

智慧园区建设是利用新一代信息与通信技术来感知、监测、分析、控制、整合园区各个关键环节的资源,在此基础上实现对各种需求做出智慧的响应,使园区整体的运行具备自我组织、自我运行、自我优化的能力,为园区企业创建一个绿色、和谐的发展环境,提供高效、便捷、个性化的发展空间。全国智慧园区存量市场超过 10000 家,复合年均增长率超过 10%。智慧园区场景中,边缘计算主要功能包括:

  1. 海量网络连接与管理:包含各类传感器、仪器仪表、控制器等海量设备的网络接入与管理;接口包括 RS485、PLC 等,协议包括 Modbus、OPC 等;确保连接稳定可靠,数据传输正确;可基于软件定义网络 SDN 实现网络管理与自动化运维。
  2. 实时数据采集与处理:如车牌识别、人脸识别、安防告警等智慧园区应用,要求实时数据采集与本地处理,快速响应。
  3. 本地业务自治:如楼宇智能自控、智能协同等应用要求在网络连接中断的情况下,能够实现本地业务自治,继续正常执行本地业务逻辑,并在网络连接恢复后,完成数据与状态同步。

2.安卓云与云游戏

目前备受关注的安卓云场景,将安卓的全栈能力云化,为终端提供统一的服务,可以节省终端的成本,促进安卓生态的发展。其中比较典型的是云游戏场景。云游戏通常指将原本运行在手机等终端上的游戏应用程序集中在边缘数据中心运行,原本由手机等终端进行的游戏加速、视频渲染等对芯片有高要求的任务,现在可以由边缘服务器代替运行。边缘服务器与终端之间传输的信息包括两类,一类是从边缘服务器向终端发送的游戏视频流信息,另一类是从终端向边缘服务器发送的操作指令信息。云游戏场景下,终端只是相当于一个视频播放设备,完全不需要高端的系统和芯片支持,就可以得到很好的游戏体验。云游戏场景的优势包括:游戏免安装、免升级、免修复、即点即玩,以及终端成本降低,具有很好的推广性。云游戏场景中,边缘计算主要功能包括:

  • 安卓全栈能力云化,匹配游戏运行环境。
  • 云端视频的渲染、压缩传输,支持终端良好呈现。
  • 端到端低时延响应,支撑游戏操作体验。

3.视频监控

视频监控正在从"看得见"“看得清"向"看得懂"发展。行业积极构建基于边缘计算的视频分析能力,使得部分或全部视频分析迁移到边缘处,由此降低对云中心的计算、存储和网络带宽需求,提高视频图像分析的效率。同时构建基于边缘计算的智能视频数据存储机制,可根据目标行为特征确定视频存储策略,实现有效视频数据的高效存储,提高存储空间利用率。边缘计算为安防领域"事前预警、事中制止、事后复核"的理念走向现实,提供有力技术支撑。视频监控场景中,边缘计算主要功能包括:

  1. 边缘节点图像识别与视频分析,支撑边缘视频监控智能化。
  2. 边缘节点智能存储机制,可根据视频分析结果,联动视频数据存储策略,既高效保留价值视频数据,同时提高边缘节点存储空间利用率。
  3. 边云协同,云端 AI 模型训练,边缘快速部署与推理,支持视频监控多点布控与多机联动。

4.工业物联网

工业物联网应用场景相对复杂,不同行业的数字化和智能化水平不同,对边缘计算的需求也存在较大差别。以离散制造为例,边缘计算在预测性维护、产品质量保证、个性化生产以及流程优化方面有较大需求。边缘计算可以支持解决如下普遍存在问题:

  1. 现场网络协议众多,互联互通困难,且开放性差。
  2. 数据多源异构,缺少统一格式,不利数据交换与互操作。
  3. 产品缺陷难以提前发现。
  4. 预测性维护缺少有效数据支撑。
  5. 工艺与生产关键数据安全保护措施不够。

工业物联网场景中,边缘计算主要功能包括:

  1. 基于 OPC UA over TSN 构建的统一工业现场网络,实现数据的互联互通与互操作。
  2. 基于边缘计算虚拟化平台构建的 vPLC (可编程逻辑控制器),支持生产工艺与流程的柔性。
  3. 图像识别与视频分析,实现产品质量缺陷检测。
  4. 适配制造场景的边缘计算安全机制与方案。

5.Cloud VR

VR (Virtual Reality,虚拟现实) 指对真实或虚拟环境的模拟或复制,通过深度感知与交互实现用户的沉浸式体验。VR 不仅用于娱乐领域,在社交、通信、房产、旅游、教育等行业也有广泛应用。VR 已经成为国家战略性新兴产业。根据 IDC 最新预测数据,2021 年全球 AR/VR 市场总投资规模接近 146.7 亿美元,并有望在 2026 年增至 747.3 亿美元,五年的复合增长率 (CAGR) 将达 38.5%。网络与云基础设施的升级带动了云 VR 业务的发展,传统的 VR 业务和终端服务器逐步迁移上云。Cloud VR 配套的终端设备"瘦"身,Cloud VR 业务逐步走入个人、家庭和工业场景。无线网络从 4G 向 5G 推进,将迎来 Cloud VR 业务在移动端的体验变革,推动云 VR 业务在 5G 网络下快速发展。Cloud VR 业务的大通量、低时延特性促使平台由集中服务向边缘分布式服务发展。部分业务,如渲染计算、转码和缓存加速,卸载分流到边缘处理。相比中心平台直接提供服务,边缘节点靠近用户终端,从距离上节省传输时延,网络带宽可降低 30%,网络响应时延降低 50%。从数据安全的角度,边缘计算有利于部分仅限本地处理的垂直行业的 VR 应用。

11.5 数字孪生体技术概述

数字孪生体技术是跨层级、跨尺度的现实世界和虚拟世界建立沟通的桥梁,是第四次工业革命的通用目的技术和核心技术体系之一,是支撑万物互联的综合技术体系,是数字经济发展的基础,是未来智能时代的信息基础设施。未来十年将成为"数字孪生体时代”。

11.5.1 数字孪生体发展历程

当前,以物联网、大数据、人工智能等新技术为代表的数字浪潮席卷全球,物理世界和与之对应的数字世界形成两大体系平行发展,相互作用。数字世界为了服务物理世界而存在,物理世界因为数字世界变得高效有序。在这种背景下,数字孪生体技术应运而生。

数字孪生体最早的概念模型由当时的 PLM 咨询顾问 Michael Grieves 博士 (现任佛罗里达理工学院先进制造首席科学家) 于 2002 年 10 月在美国制造工程协会管理论坛上提出。数字孪生体 (Digital Twin) 这一名称最早出现在美国空军实验室 2009 年提出的"机身数字孪生体 (Airframe Digital Twin)” 概念中。2010 年,NASA 在《建模、仿真、信息技术和处理》和《材料、结构、机械系统和制造》两份技术路线图中直接使用了"数字孪生体 (Digital Twin)” 这一名称。2011 年 Michael Grieves 博士在其新书《虚拟完美》中引用 NASA 先进材料和制造领域首席技术专家 John Vickers (现任马歇尔中心材料与工艺实验室副主任和 NASA 国家先进制造中心主任) 所建议的"数字孪生体 (Digital Twin)" 这一名称,作为其信息镜像模型的别名。2013 年,美国空军将数字孪生体和数字线程作为游戏规则改变者列入其《全球科技愿景》。

回顾数字孪生体的发展历程,可以看到航天发射任务和航空武器装备研制的需求拉动作用,也可以看到建模、仿真、系统工程等的技术推动作用。总结数字孪生体的发展历程,可以分为四个阶段。

  1. 1960—21 世纪初,是数字孪生体的技术准备期,主要是指 CAD/CAE 建模仿真、传统系统工程等预先技术的准备。
  2. 2002—2010 年,是数字孪生体的概念产生期,指数字孪生体模型的出现和英文术语名称的确定。这段时间,预先技术继续成熟,出现了仿真驱动的设计、基于模型的系统工程 (MBSE) 等先进设计范式。
  3. 2010—2020 年,是数字孪生体的领先应用期,主要指 NASA、美军方和 GE 等航空航天、国防军工机构的领先应用。这段时间也是物联网、大数据、机器学习、区块链、云计算等外围使能技术的准备期。目前数字孪生体的定义不下 20 个,大部分 IT 厂商、工业巨头和咨询机构都有自己的定义或与自身业务相关的数字孪生体解决方案。从 2018 年开始,ISO、IEC、IEEE 三大标准化组织陆续开始着手数字孪生体相关标准化工作,第一个数字孪生体国际标准将于明年发布。
  4. 2020—2030 年,是数字孪生体技术的深度开发和大规模扩展应用期。可以看出,PLM 领域,或者说以航空航天为代表的离散制造业,是数字孪生体概念和应用的发源地。目前,数字孪生体技术的开发正与上述外围使能技术深度融合,其应用领域也正从智能制造等工业化领域向智慧城市、数字政府等城市化、全球化领域拓展。

11.5.2 数字孪生体的定义

AFRL 于 2009 年提出,机身数字孪生体是一个由数据、模型分析工具构成的集成系统。该系统不仅可以在整个生命周期内表达飞机机身,还可以依据非确定信息对整个机队和单架机身进行决策,包括当前诊断和未来预测。

Dr.Michael Grieves 于 2011 年提出,虚拟产品是与某种特定用途相关的基于比特的信息化表达,和基于原子的物理产品及其自然行为所构成的基于规则的关联环境。虚拟化是为基于原子的物理产品创建基于比特的信息化表达的过程。信息镜像模型作为概念化 PLM 的框架,揭示了物理产品和虚拟产品二元性的含义。使用虚拟产品代替物理产品的能力体现了信息镜像模型的价值。

DOD 于 2014 年提出,数字线程:一个可扩展、可配置和组件化的企业级分析框架,基于数字系统模型的模板,可以无缝加速企业数据信息知识系统中授权技术数据、软件、信息和知识受控交互,通过访问和集成不同数据并转换为可操作信息,可在系统整个生命周期中为决策者提供支持。数字孪生体:数字线程支持的已建系统的多物理场、多尺度和概率集成仿真,通过使用最佳可用模型、传感器更新和输入数据来镜像和预测其对应物理孪生体全生命期内的活动和性能。

PTC 于 2015 年提出,数字孪生体是中物 (产生数据的设备和产品)、连接 (搭接网络)、数据管理 (云计算、存储和分析) 和应用构成的数。因此,它将深度参与物联网平台的定义与构建。

Michael Grieves & John Vickers 于 2016 年提出,数字孪生体是一组虚拟信息结构,可以从微观原子级别到宏观几何级别全面地描述现有或将有的物理制成品。在最佳状态下,可以通过数字孪生体获得任何实测得到的物理制成品的信息。数字孪生体有三种类型:数字孪生原型体、数字孪生实例体和数字孪生聚合体。而数字孪生环境则是数字孪生体的操作环境。

2017 年有专家提出,智慧城市数字孪生体是一个智能的、支持物联网、数据丰富的城市虚拟平台,可用于复制和模拟真实城市中发生的变化,以提升城市的弹复性、可持续发展和宜居性。

SAP 于 2018 年提出,单个数字孪生体是物理对象或系统的虚拟表达,但不仅仅是高科技外观。众多数字孪生体使用数据、机器学习和物联网来帮助企业优化、创新和提供新服务。

ISO CD 23247 于 2019 年提出,数字孪生体:是现实事物 (或过程) 具有特定目的的数字化表达,并通过适当频率的同步使物理实例与数字实例之间趋向一致。

从以上美军军方和各企业的定义后,我们可以得到数字孪生体的定义如下:数字孪生体是现有或将有的物理实体对象的数字模型,通过实测、仿真和数据分析来实时感知、诊断、预物理实体对象的状态,通过优化和指令来调控物理实体对象的行为,通过相关数字模型间的相互学习来进化自身,同时改进利益相关方在物理实体对象生命周期内的决策。将"Digital Twin" 译为"数字孪生体"。加上这个"体"字,是为了借用了中文"体"字语义的模糊性来应对和减少 Digital Twin 译成中文时在不同使用场景下的不确定性。“体"字的中文语义的模糊性表现在它有两种含义:

  1. 事物的本身或全部,如物体、实体 (object,entity);
  2. 事物的格局或规矩,如体制、体系。中文中,体系一词也是多义词:系统 (system),如技术体系;系统之系统 (system of systems),如体系工程。

为数字孪生加上"体"字后,数字孪生体就是一个名词,这样为 digital(ly)twinned/twinning 的翻译挪出了空间,方便相关术语体系的构建。因此,“数字孪生体"这个术语有如下几种使用场合和含义:

  1. Digital Twin 这一现象背后所包含的技术体系、所代表的跨学科工程领域,以及作为通用目的技术引发的商业、经济和社会影响体系,如数字孪生体时代。
  2. 物理实体对象的某种数字化孪生模型的抽象类型或实例,如数字孪生体可分为数字孪生原型体、数字孪生实例体和数字孪生聚合体。
  3. 具体应用场景下物理实体对象的数字化孪生模型,如某个或某类产品、工厂、城市、产业、战场等的数字孪生体。此时,如果是强调物理实体对象或者物理实体与数字孪生体并重,也可将数字孪生作为形容词定语,放在物理实体对象之前,而不用"体"字,相当于英文的 digitally twinned。例如,数字孪生制造、数字孪生城市等。
  4. 在某些物理实体与数字孪生体并重的场合,如架构设计或实现等,可将数字孪生体与对应物理实体对象及相关使能实体对象所构成的系统称为数字孪生系统。

11.5.3 数字孪生体的关键技术

建模、仿真和基于数据融合的数字线程是数字孪生体的三项核心技术。能够做到统领建模、仿真和数字线程的系统工程和 MBSE,则成为数字孪生体的顶层框架技术,物联网是数字孪生体的底层伴生技术,而云计算、机器学习、大数据、区块链则成为数字孪生体的外围使能技术。

1.建模

数字化建模技术起源于 20 世纪 50 年代。建模的目的是将我们对物理世界的理解进行简化`和模型化。而数字孪生体的目的或本质是通过数字化和模型化,用信息换能量,以使少的能量消除各种物理实体、特别是复杂系统的不确定性。所以建立物理实体的数字化模型或信息建模技术是创建数字孪生体、实现数字孪生的源头和核心技术,也是"数化"阶段的核心。

将数字孪生体放在工业化、城市化和全球化所指向的人类文明可持续发展的大目标下,数字孪生体所需的建模技术也需要放在数字孪生体应用场景的参考框架下考察。具体地说,数字孪生体的概念模型中数字模型的视角类型的三个维度:需求指标、生存期阶段和空间尺度构成了数字孪生体建模技术体系的三维空间。

在某个应用场景下的某种建模技术,只能提供某类物理实体某个视角的模型视图。这时数字孪生体和对应物理实体间的互动 (状态感知和对象控制的数据流和信息流传递),一般只能满足单个低层次具体需求指标的要求。对于复合的、高层次需求指标,通常需要有反映若干建模视角的多视图模型所对应的多个数字孪生体与同一个物理实体对象实现互动。这时的多视图或多视角一般来自物实体对象的不同生存期阶段或多个系统层次/物质尺度,多视图模型间的协同就需要数字线程技术的支持。

2.仿真

从技术角度看,建模和仿真是一对伴生体。如果说建模是模型化我们对物理世界或问题的理解,那么仿真就是验证和确认这种理解的正确性和有效性。所以,数字化模型的仿真技术是创建和运行数字孪生体、保证数字孪生体与对应物理实体实现有效闭环的核心技术。

仿真是将包含了确定性规律和完整机理的模型转化成软件的方式来模拟物理世界的一种技术。只要模型正确,并拥有了完整的输入信息和环境数据,就可以基本准确地反映物理世界的特性和参数。

3.其他技术

除了核心的建模仿真技术,目前 VR、AR 以及 MR 等增强现实技术、数字线程、系统工程和 MBSE、物联网、云计算、雾计算、边缘计算、大数据技术、机器学习和区块链技术,仍为数字孪生体构建过程中的内外围核心技术。

11.5.4 数字孪生体的应用

数字孪生体主要应用于制造、产业、城市和战场。

1.制造

在制造领域,一些传统的技术,如 CAD 和 CAE,天然就是为物理产品数字化而生,一些新兴技术,如 AI、AR、IoT 也为更逼真、更智能、更交互的数字孪生体插上了翅膀。可以预见,数字孪生体在研发设计和生产制造环节将会起到越来越大的作用,成为智能制造的基石。

在产品的设计阶段,使用数字孪生体可提高设计的准确性,并验证产品在真实环境中的性能,主要功能包括数字模型设计、模拟和仿真。对产品的结构、外形、功能和性能 (强度、刚度、模态、流场、热、电磁场等) 进行仿真,用于优化设计、改进性能的同时,也降低成本。在个性化定制需求盛行的今天,设计需求及其变更信息的实时获取成为企业的一项重要竞争力,可以实时反馈产品当前运行数据的数字孪生体,成为解决这一问题的关键。曾经在实验科学中广为应用的半实物仿真也将在数字孪生体中发挥重要作用。

在产品的制造阶段,使用数字孪生体可以使产品导入时间短,提高设计质量,降低生产成本和加快上市速度。制造阶段的数字孪生体是一个高度协同的过程,通过数字化手段构建起来的数字生产线,将产品本身的数字孪生体同生产设备、生产过程等其他形态的数字孪生体形成共智关系,实现生产过程的仿真、数字化、关键指标的监控和过程能力的评估。同时,数字生产线与物理生产线实时交互,物理环境的当前状态作为每次仿真的初始条件和计算环境,数字生产线的参数优化之后,实时反馈到物理生产线进行调控。在敏捷制造和柔性制造大为盛行的今天,对多个生产线之间的协调生产提出更高要求,多个生产线的数字孪生体之间的"共智"将是满足这一需求的有效方案。

2.产业

数字孪生体以云计算、大数据、物联网、人工智能和区块链等 IT 和 DT 使能技术为支撑,与行业趋势和产业升级需求相结合,构建实体的数字镜像。通过多种组合集成形式,按照数化、互动、先知、先觉、共智的顺序逐渐深入应用,最终实现"服务型制造"和"数字经济"等产业发展目标。

数字孪生体与各种或 DT 使能技术结合,在复杂产品的产业链中具有广泛的应用价值。构建全产业链的数字孪生体,同时与制造技术相结合,促进传统产业向智慧化和服务型制造转型,迎接批量个性化定制时代的到来。主要有在市场营销和电子商务、供应链和物流领域,侧重于如何向"批量"订单的挑战,在产品使用和维保领域,则侧重于如何迎接"复杂"产品高可靠性的挑战。

数字孪生体在全产业链上的应用,除研发和制造领域外,还在市场营销、供应链物流和维保服务三大领域发挥巨大作用。

3.城市

要建成新型智慧城市,首先要构建城市的数字孪生体。城市级的整体数字化是城级智慧化的前提条件。数字孪生城市的发展与应用内涵,直接体现了新型智慧城市想要达到的愿景和目标。它是城市实现智慧管理的重要设施和基础能力,是技术驱动下城市信息化从量变走向质变的里程碑。

数字孪生体在城市建设与发展中的核心价值在于,它能够在现实世界和数字世界之间全面建立实时联系,进而对城市物理实体全生命期的变化进行数字化、模型化和可视化。数字孪生城市具有传感监控即时性、城市信息集成性、信息传递交互性、发展决策科学性、控制管理智能性、城市服务便捷性等特征。通过数字孪生城市的建设,在数字空间再造一个城市,作为现实城市的映射和镜像。通过大规模仿真、推演、预测,定位分析未来城市运行中可能遇到的瓶颈问题与社会风险,以及与其他数字孪生城市进行"共智”,更好地实现传统智慧城建设向数字孪生城市的过渡,进一步提高城市建设的智慧化程度,以及促进城市群之间的互动协作。

4.战场

人类文明史也可以说是一部战争史,战争是人类发展的主旋律。绝大多数技术总是首先应用并成熟于军事。虽然目前国内外数字孪生体在军事领域应用的报告、文章和报道不多,但并不代表不用。

总体来讲,数字孪生体作为一种新理论和新技术在战争应用的作用谓之于"察”,使战争进行和战争效果显性化,从而辅助于战争决策,数字孪生体技术在军事方面的应用又可以分为单体装备应用和战场综合应用。前者主要用于装备的研发、维护和保养等,属于数字孪生制造的范畴;后者要是通过数字孪生体完成或服务于战场目标的达到,是一个复杂的、体系级的数字孪生体高层次应用。

军事战争从上到下可以分为战略 (决策)、战役、战术三个层次,从未来和理想角度上讲,数字孪生体技术应当满足所有战争层面的应用。

11.6 云计算和大数据技术概述

大数据和云计算已成为 IT 领域的两种主流技术。“数据是重要资产"这一概念已成为大家的共识,众多公司争相分析、挖掘大数据背后的重要财富。同时学术界、产业界和政府都对云计算产生了浓厚的兴趣:全球范围内讨论云计算技术学术活动如火如荼;谷歌、亚马逊、IBM、微软等 IT 巨头大力推动云计算技术的宣传和产品的普及。各国政府斥巨资纷纷打造大规模数据中心与计算中心。而本节将分别对云计算和大数据技术进行一个概述。

11.6.1 云计算技术概述

1.云计算相关概念

云计算 (Cloud Computing) 这一概念于 2007 年 10 月 8 日正式出现,其标志性事件是谷歌和 IBM 宣布联合加入"云计算"的研究工作,给出"云计算"的定义。同年 11 月 15 日,IBM 上海和阿莫科 (Armok,NY) 同时发布了"Blue Cloud”,Blue Cloud 是一系列的云计算产品,使得共同的数据中心像互联网一样运作。本章以 IBM 的"云计算"定义为例进行解读。

2007 年 10 月,IBM 的 Greg Boss 等人以技术白皮书的形式给出了"云计算"的定义:"‘云计算’是同时描述一个系统平台或者一类应用程序的术语。云计算平台按需进行动态部署、配置、重新配置以及取消服务等。在云计算平台中的服务器可以是物理或虚拟的服务器。高级的计算云通常包含一些其他的计算资源,例如存储区域网络 (SANs),网络设备,防火墙以及其他安全设备等。

在应用方面,云计算描述了一类可以通过互联网进行访问的可扩展应用程序。这类云应用基于大规模数据中心及高性能服务器来运行网络应用程序与 Web 服务。用户可以通过合适的互联网接入设备以及标准的浏览器就能够访问云计算应用程序。"

IBM 的定义明确指出云计算概念的内涵包含两个方面:平台和应用。平台即基础设施,其地位相当于 PC 上的操作系统,云计算应用程序需要构建在平台之上;云计算应用所需的计算与存储通常在"云端"完成,客户端需要通过互联网访问计算与存储能力。

2.云计算的服务方式

在对云计算定义深入理解的基础上,产业界和学术界对云计算的服务方式进行了总结。目前一致认为云计算自上而下具有"软件即服务 (Software as a Service)"、“平台即服务 (Platform as a Service,PaaS)” 和"基础设施即服务 (Infrastructure as a Service,IaaS)" 三类典型的服务方式,下面将依次简要论述。

1)软件即服务 (SaaS)

在 SaaS 的服务模式下,服务提供商将应用软件统一部署在云计算平台上,客户根据需要通过互联网向服务提供商订购应用软件服务,服务提供商根据客户所订购软件的数量、时间的长短等因素收费,并且通过标准浏览器向客户提供应用服务。

2)平台即服务 (PaaS)

在 PaaS 模式下,服务提供商将分布式开发环境与平台作为一种服务来提供。这是一种分布式平台服务,厂商提供开发环境、服务器平台、硬件资源等服务给客户,客户在服务提供商平台的基础上定制开发自己的应用程序,并通过其服务器和互联网传递给其他客户。

3)基础设施即服务 (IaaS)

在 IaaS 模式下,服务提供商将多台服务器组成的"云端"基础设施作为计量服务提供给客户。具体来说,服务提供商将内存、I/O 设备、存储和计算能力等整合为一个虚拟的资源池,为客户提供所需要的存储资源、虚拟化服务器等服务。

对三种服务方式进行分析后,可以看出这三种服务模式有如下特征:

  1. 在灵活性方面,SaaS→PaaS→IaaS 灵活性依次增强。这是因为用户可以控制的资源越来越底层,粒度越来越小,控制力增强,灵活性也增强。
  2. 在方便性方面,IaaS→PaaS→SaaS 方便性依次增强。这是因为 IaaS 只是提供 CPU、存储等底层基本计算能力,用户必须在此基础上针对自身需求构建应用系统,工作量较大,方便性较差。而 SaaS 模式下,服务提供商直接将具有基本功能的应用软件提供给用户,用户只要根据自身应用的特定需求进行简单配置后就可以使得应用系统上线,工作量较小,方便性较好。

PaaS 是云计算服务模式中最为关键的一层,在整个云计算体系中起着支撑的作用。PaaS 通常以特定的互联网资源为中心,采用开放平台的形式,对外提供基于 Web 的 API 服务。PaaS 的地位相当于系统软件,需要为上层 SaaS 应用提供 API,以支持各种 SaaS 应用的开发。除了一些基础性的 API 之外,PaaS 还要提供更多高级的服务型 API。这样,上层的应用就可以利用这些高级服务,构建面向最终用户的具体应用。

3.云计算的部署模式

根据 NIST 的定义,云计算从部署模式上看可以分为公有云、社区云、私有云和混合云四种类型。下面将分别进行介绍。

1)公有云

在公有云模式下,云基础设施是公开的,可以自由地分配给公众。企业、学术界与政府机构都可以拥有和管理公用云,并实现对公有云的操作。

公有云能够以低廉的价格为最终用户提供有吸引力的服务,创造新的业务价值。作为支撑平台,公有云还能够整合上游服务 (如增值业务、广告) 提供商和下游终端用户,打造新的价值链和生态系统。

2)社区云

在社区云模式下,云基础设施分配给一些社区组织所专有,这些组织共同关注任务、安全需求、政策等信息。云基础设施被社区内的一个或多个组织所拥有、管理及操作。

“社区云"是"公有云"范畴内的一个组成部分,指在一定的地域范围内,由云计算服务提供商统一提供计算资源、网络资源、软件和服务能力所形成的云计算形式。即基于社区内的网络互连优势和技术易于整合等特点,通过对区域内各种计算能力进行统一服务形式的整合,结合社区内的用户需求共性,实现面向区域用户需求的云计算服务模式。

3)私有云

在私有云模式下,云基础服务设施分配给由多种用户组成的单个组织。它可以被这个组织或其他第三方组织所拥有、管理及操作。

4)混合云

混合云是公有云、私有云和社区云的组合。由于安全和控制原因,并非所有的企业信息都能放置在公有云上,因此企业将会使用混合云模式,将公有信息和私有信息分别放置在公有云和私有云环境中。在混合云构建方面,大部分企业选择同时使用公有云和私有云,有一些也会同时建立社区云。

4.云计算的发展历程

根据云计算的定义和内涵,这里将从虚拟化技术、分布式计算技术和软件应用模式三个方面对云计算的历史发展进行简要论述。其中虚拟化技术的发展可以看作是 IaaS 服务模式的发展历程,分布式计算技术的发展可以看作是 PaaS 服务模式的发展历程,软件应用模式的发展可以看作是 SaaS 的发展历程。

1)虚拟化技术的历史

1959 年 6 月的国际信息处理大会 (International Conference on Information Processing) 上,计算机科学家 Christopher Strachev 发表了论文《大型高速计算机中的时间共享》 (Time Sharing in Large Fast Computers),首次提出并论述了虚拟化技术。

虚拟化的核心思想是使用虚拟化软件在一台物理机上虚拟出一台或多台虚拟机,虚拟机是指使用系统虚拟化技术,运行在一个隔离环境中、具有完整硬件功能的逻辑计算机系统,包括客户操作系统和其中的应用程序。采用虚拟化技术可以实现计算机资源利用的最大化。

自 x86 平台软件虚拟化技术逐步发展,存储虚拟化从 NAS/SAN 向 VTL 发展,网络虚拟化随着服务器虚拟化而出现。

2)分布式计算技术的发展

分布式计算是指具有多个处理和存储的硬件和软件系统、并发进程或多个程序在松耦合或集中控制的方式下进行任务处理的计算方式。在分布式计算中,一个程序被分割成若干部分,在一个计算机网络环境中执行。分布式计算是并行计算的一种形式,但是并行计算通常描述一个程序的不同部分在同一台计算机内多个处理器中的运行情况。这两种计算方式都需要将程序划分为可以同时执行的部分,但是分布式程序通常强调环境的异构性:即具有不同延迟的网络连接以及在网络中或计算机之间不可预知的失效。

分布式计算技术从 20 世纪 70 年代左右出现至今,大致经历了程序在多处理器上的运行、分布式对象、Web 服务、网格计算、对等计算和效用计算等几个主要的阶段。

3)软件应用模式的发展

SaaS 的概念起源于 1999 年之前。2000 年 12 月,贝内特等人指出"SaaS 将在市场上获得接受”。“软件即服务"的常见用法和简称始于刊登在 2001 年 2 月 SIA 的白皮书"战略背景:软件即服务”。

2003 年以 Salesforce 为代表,当时的 ASP (Application Service Provider,应用软体租赁服务提供者) 企业开始以 SaaS 为模式提供软件服务。从本质上说,SaaS 和 ASP 的差异不大,基于在线软件服务模式的技术与市场已经变得相对成熟。

2003 年后,美国 Salesforce、WebEx Communication、Digital Insight 等企业 SaaS 模式取得成功。国内厂商也开始涉足 SaaS 应用,包括用友、金算盘、金碟、阿里巴巴、XTools、八百客等。与此同时,微软、谷歌、IBM、甲骨文、SAP 等 IT 厂商也开始进入中国 SaaS 市场。

SaaS 虽然在中国起步较晚,但由于国内行业特征非常适合 SaaS 应用模式,目前备受业界的关注。据统计我国约有 1200 万家中小企业,这是一个数量非常庞大的潜在 SaaS 消费群体。企业用户可以根据自己的应用需要从服务提供商那里定购相应的应用软件服务,并且可以根据企业发展的变化来调整所使用的服务内容,具有很强的伸缩性和扩展性,同时这些应用服务所需要的维护与技术支持也都是由服务商的专业人员来承担。

在客户通过 SaaS 获得收益的同时,对于服务提供商而言就变成了巨大的潜在市场。因为以前那些数量庞大的、因为无法承担软件许可费用或没有能力招募专业 IT 人员的中小型企业,在 SaaS 模式下都变成了潜在客户。同时,SaaS 模式还可以帮助厂商增强差异化的竞争优势,降低开发成本和维护成本,加快产品或服务进入市场的节奏,有效降低营销成本,改变自身的收入模式,改善与客户之间的关系。SaaS 对客户和厂商而言,都具有强大的吸引力,将会给客户和厂商之间带来双赢的大好局面。因此,SaaS 是云计算技术下具有旺盛生命力的应用模式。

11.6.2 大数据技术概述

1.大数据的定义

1)维基百科的定义

大数据是指其大小或复杂性无法通过现有常用的软件工具,以合理的成本并在可接受的时限内对其进行捕获、管理和处理的数据集。这些困难包括数据的收入、存储、搜索、共享、分析和可视化。

2)Granter 的定义

Granter 公司关注大数据的三个量化指标:数据量、数据种类和处理速度。Granter 认为传统的存储技术难以应付大数据处理,主要存在以下三大挑战。

挑战一:不断增长的数据量。在大数据背景下,数据这一宝贵财富通常是不能删除的,因此数据将不断积累增长,增长速度经常超出人们预计。信息中心需要管理 TB 级甚至 PB 级数据。要为这些数据提供存储、保护和使用的方案,信息系统需要不断地作相应升级或重构,需要投入大量人力物力。

挑战二:多格式数据。海量数据包括了越来越多不同格式的数据,这些不同格式的数据也需要不同的处理方法。从简单的电子邮件、数据日志和信用卡记录,再到仪器收集到的科学研究数据、医疗数据、财务数据以及丰富的媒体数据 (包括照片、音乐、视频等),都具有这个特点。

挑战三:性能。速度是指数据从客户端到处理器和存储的移动速度,涉及终端数据处理能力、数据流访问和交付、服务器计算处理能力和后端存储的吞吐能力。速度意味着要求数据必须以足够快的频率被处理。大数据处理需要不同于交易类应用的速度,通常其对带宽的要求比 I/O 操作的速度更重要。

3)IBM 的定义

IBM 认为大数据横跨三个层面:数量,速度和品种。IBM 将大数据概括为三个 V,即大规模 (Volume)、高速度 (Velocity) 和多样化 (Variety),这些特点也反映了大数据所潜藏的价值 (Value,第四个"V")。因此大数据的特征可以整体概括为:“海量+多样化+快速处理+价值”。

4)SAS 的定义

SAS 在大数据传统"3V" 模型定义的基础上加入了"可变性"和"复杂性"两个重要特征。

可变性主要反映了数据流可能具有高度的不一致性,并存在周期性的峰值。对日常的、季节性和时间驱动的峰值数据流的管理具有挑战性,特别是当社交媒体介入的情况下。

复杂性主要体现在数据来源的多样性上。连接、匹配、清洗和转化来自多个系统的数据是一件非常复杂的事情。除此以外,还需要考虑不同数据源之间的连接关系、关联关系和层次关系等。需要实施数据治理策略,帮助企业系统地集成结构化和非结构化数据资产,产生高质量、恰当的、最新的有用信息。

2.大数据的研究内容

2012 年冬季,来自 IBM、微软、谷歌、HP、MIT、斯坦福、加州大学伯克利分校、UIUC 等产业界和学术界的数据库领域专家通过在线的方式共同发布了一个关于大数据的白皮书。该白皮书首先指出大数据面临着 5 个主要问题,分别是异构性 (Heterogeneity)、规模 (Scale)、时间性 (Timeliness)、复杂性 (Complexity) 和隐私性 (Privacy)。在这一背景下,大数据的研究工作将面临 5 个方面的挑战:

  • 挑战一:数据获取问题。我们需要决策哪些数据需要保持或丢弃等问题,目前这些决策还只能采用特设方法给出。
  • 挑战二:数据结构问题。如何将没有语义的内容转换为结构化的格式,并进行后续处理。
  • 挑战三:数据集成问题。只有将数据之间进行关联,才能充分发挥数据的作用,因此数据集成也是一项挑战。
  • 挑战四:数据分析、组织、抽取和建模是大数据本质的功能性挑战。数据分析是许多大数据应用的瓶颈,目前底层算法缺乏伸缩性、对待分析数据的复杂性估计不够,等等。
  • 挑战五:如何呈现数据分析的结果,并与非技术的领域专家进行交互。

为了应对上述挑战,白皮书建议采用现有成熟技术解决大数据带来的挑战,并给出了大数据分析的分析步骤,大致分为数据获取/记录、信息抽取/清洗/注记、数据集成/聚集/表现、数据分析/建模和数据解释 5 个主要阶段。在每个阶段都面临着各自的研究问题。

1)数据获取和记录

研究数据压缩中的科学问题,能够智能地处理原始数据,在不丢失信息的情况下,将海量数据压缩到人可以理解的程度;研究"在线"数据分析技术,能够处理实时流数据;研究元数据自动获取技术和相关系统;研究数据来源技术,追踪数据的产生和处理过程。

2)信息抽取和清洗

一般来说,收集到的信息需要一个信息抽取过程,才能用来进行数据分析。抽取的对象可能包含图像、视频等具有复杂结构的数据,而且该过程通常是与应用高度相关的。

一般认为,大数据通常会反映事实情况,实际上大数据中广泛存在着虚假数据。关于数据清洗的现有工作通常假设数据是有效的、良好组织的,或对其错误模型具有良好的先验知识,这些假设在大数据领域将不再正确。

3)数据集成、聚集和表示

由于大量异构数据的存在,大数据处理不能仅仅是对数据进行记录,然后就将其放入存储中。如果仅仅是将一堆数据放入存储中,那么其他人就可能无法查找、修改数据,更不能使用数据了。即使各个数据源都存在元数据,将异构数据整合在一起仍然是一项巨大的挑战。

对大规模数据进行有效分析需要以自动化的方式对数据进行定位、识别、理解和引用。为了实现该目标,需要研究数据结构和语义的统一描述方式与智能理解技术,实现机器自动处理,从这一角度看,对数据结构与数据库的设计也显得尤为重要。

4)查询处理、数据建模和分析

大数据中的噪声很多,具有动态性、异构性、关联性、不可信性等多种特征。尽管如此,即使是充满噪声的大数据也可能比小样本数据更有价值,因为通过频繁模式和相关性分析得到的一般统计数据通常强于具有波动性的个体数据,往往透露更可靠的隐藏模式和知识。互联的大数据可形成大型异构的信息网络,可以披露固有的社区,发现隐藏的关系和模式。此外,信息网络可以通过信息冗余以弥补缺失的数据、交叉验证冲突的情况、验证可信赖的关系。

数据挖掘需要完整的、经过清洗的、可信的、可被高效访问的数据,以及声明性的查询 (例如 SQL) 和挖掘接口,还需要可扩展的挖掘算法及大数据计算环境。在 TB 级别上的可伸缩复杂交互查询技术是目前数据处理的一个重要的开放性研究问题。当前的大数据分析的一个问题是缺乏数据库系统之间的协作,需要研究并实现将声明性查询语言与数据挖掘、数据统计包有机整合在一起的数据分析系统。

5)解释

仅仅有能力分析大数据本身,而无法让用户理解分析结果,这样的效果价值不大。如果用户无法理解的分析。最终,一个决策者需要对数据分析结果进行解释。对数据的解释不能凭空出现,通常包括检查所有提出的假设并对分析过程进行追踪和折回分析。此外,分析过程中可能引入许多可能的误差来源:计算机系统可能有缺陷、模型总有其适用范围和假设、分析结果可能基于错误的数据等。在这种情况下,大数据分析系统应该支持用户了解、验证、分析电脑所产生的结果。大数据由于其复杂性,这一过程特别具有挑战性,是一个重要的研究内容。

在大数据分析的情景下,仅仅向用户提供结果是不够的。相反,系统应该支持用户不断提供附加资料,解释这种结果是如何产生的。这种附加资料 (结果) 称之为数据的出处 (data provenance)。通过研究如何最好地捕获、存储和查询数据出处,同时配合相关技术捕获足够的元数据,就可以创建一个基础设施,为用户提供解释分析结果,重复分析不同假设、参数和数据集的能力。

具有丰富可视化能力的系统是为用户展示查询结果,进而帮助用户理解特定领域问题的重要手段。早期的商业智能系统主要基于表格形式展示数据,大数据时代下的数据分析师需要采用强大的可视化技术对结果进行包装和展示,辅助用户理解系统,并支持用户进行协作。

此外,通过简单的单击操作,用户应该能够向下钻取到每一块数据,看到和了解数据的出处。针对上述需求,需要研究新的交互方式,支持用户采用"玩"的方式对数据分析过程进行小的调整,并立即对增量化的结果进行查看。通过这种方法,用户能够对分析结果有一个直观的理解,从而帮助用户更好地理解大数据背后的价值。

3.大数据的应用领域

1)制造业的应用

制造业目前正在向信息化和自动化的方向发展。在产品的设计、生产和销售中,越来越多的企业使用计算机辅助设计 (CAD)、计算机辅助制造 (CAM) 等软件,数控机床、传感器等设备,物料需求计划 (MRP)、企业资源计划 (ERP) 等系统。这些信息技术的应用大大提高了工作效率和产品质量。

然而,随着信息化的不断深入,制造业目前所面临的挑战是在产业信息化之后,如何提升获取和开拓市场需求的能力,从而创造出更有价值的商品。如今,企业管理信息系统中存储的信息,各种工业传感器和数控设备中产生的数据,都将汇集到一起形成大数据,以提高生产效率为目标的信息化制造业转变成以掌握用户需求为目标的智慧化制造业。大数据为制造业的创新转型 (无论是精益化提升还是服务化转型) 提供了新的路径和方式。

另一方面,海量数据扩大了算法和运筹学的应用领域。例如,在部分制造企业,算法对生产线的传感器信息进行分析,形成了自我调节的流程,从而减少了浪费,避免了代价高昂 (有时还十分危险) 的人为干预,最终提升产量。

现在,从复印机到喷气发动机等各种产品都可以产生能跟踪其使用情况的数据流。制造商能够分析输入数据,并有可能主动纠正软件缺陷或派遣服务代表到现场维修。一些计算机硬件供应商正在收集和分析这些信息,在发生故障导致客户运营中断前未雨绸缪,提前维护。这些信息还可以用于实施产品变化、预防未来问题的发生、提供客户使用信息等方面,为下一代产品开发提供灵感和思路。

2)服务业的应用

传统的服务业有着悠久的历史。当信息时代到来的时候,服务业就衍化出现了两种形态:一种是信息技术与服务业相结合的信息服务业,另一种是应用信息技术改造传统服务业而来的服务业。前者包括计算机软件、通信服务、信息咨询服务等,后者包括信息化改造后的商业、金融业、旅游业等。大数据恰恰就在这两者之间起到牵线搭桥的作用:一方面它使得信息服务业从提供软硬件技术服务升级到提供智慧解决方案,另一方面它将改变现有的服务业业态模式,将关注点转向数据。

在信息服务业,最常见的大数据分析当属网络公司收集用户的网页点击行为提供有个性化的广告与信息推送服务,需要注意的是这些行为需要考虑用户隐私的保护问题。

在信息化改造后的服务业,大数据更是无处不在。在零售行业,厂商可以通过互联网点击流实时跟踪客户行为、更新客户偏好、建立可能行为的模型。在此基础上,厂商能够确定客户下次购买的时间,通过捆绑优选商品、提供省钱的奖励性计划、对交易实施微调等措施,最终使得整个销售圆满结束。在金融行业,银行可以从大量数据中发现信用卡欺诈和盗用;理财网站从统计的消费数据中来预测宏观的经济趋势;保险公司通过大数据能够找出可疑的权利要求。在旅游行业,企业致力于旅游预订数据的收集、分析与处理,例如,微软的 Bing 搜索引擎能够根据其存储的机票历史数据,帮助用户决定购买航班的最佳时间和最优惠价格。

3)交通行业的应用

当前,出行难问题对各大城市来说都亟待解决。当前,可以利用先进的传感技术、网络技术、计算技术、控制技术、智能技术,对道路和交通进行全面感知。而在大数据时代下的智慧交通,需要融合传感器、监视视频和 GPS 等设备产生的海量数据,甚至与气象监测设备产生的天气状况等数据相结合,从中提取出人们真正需要的信息,及时而准确地进行发布和推送,通过计算直接提供最佳的出行方式和路线。

4)医疗行业的应用

医疗健康问题是当前社会普遍关注的焦点问题。以往,人们总是在发现自己生病时才看病就医,而且到了医院还要经历挂号、求诊、配药等复杂流程,整个过程需要耗费大量时间,容易形成就医难的困境。如今,基于电子医疗记录技术,电子病历正逐渐被各大医疗机构所采用。在去医院前,可以通过网上预约挂号;在就医时,仅使用一张 IC 卡就能付费;医生还可以将问诊过程中的记录,病人的化验单、拍片等诊断数据输入电脑以备随时调用。

在大数据时代,可以将医疗机构的电子病历记录标准化,形成全方位多维度的大数据仓库。系统首先全面分析患者的基本资料、诊断结果、处方、医疗保险情况和付款记录等诸多数据,再将这些不同的数据综合起来,在医生的参与下通过决策支持系统选择最佳的医疗护理解决方案。

本系列共 21 篇,本文为第 11 篇 · 查看全部
使用 Hugo 构建
主题 StackJimmy 设计