创新力是现代战争的战斗力。随着认知域作战等新的作战样式浮出水面,“制认知权”已成为未来作战的新高地。从技术视角看,“制认知权”集中体现为“算力+数据+算法”的综合较量,“算力等于战力、算法就是战法、软件定义战争”将成为智能化战争的鲜明特征,“谁的算力更强,谁就能占据制胜先机”成为新的战争制胜规律。面对认知域的新挑战,传统计算范式和存储模式将如何发展?计算系统如何在优化迭代中获得更高能力?带着这些问题,记者采访了复旦大学计算机科学技术学院张为华教授。
智能计算将成为新的计算范式
当今世界,诸多具有主动认知能力的智能化装备纷纷亮相,“忠诚僚机”无人机、“黄貂鱼”无人加油机、卫星机器人、“网络空间飞行器”、“自适应雷达对抗”等项目纷纷涌现。在“云-边-端”环境下,各种智能设备环绕在人们周围,成为了连接人脑认知与信息系统的桥梁和纽带。但是,当前的计算体系架构在“人—机—物”的高效协同时,缺乏并行管理架构,计算效率低、耗能大,无法满足万物互联场景下复杂多变的应用需求。同时,因为各种智能设备、智能应用爆发式增长,带来数据量的“爆炸式”增长,带来对计算能力的“指数级”需求。根据国际数据公司IDC的预测,2025年全球数据总量将达到175ZB。面对如此巨大的计算需求,传统计算范式已经难以“承受之重”。以超算为例,实际计算效率仅为峰值速度的15%左右。强大的计算资源因为没有得到有效利用,难以在认知对抗的强烈需求下发挥应有的作用
计算+数据=人工智能(蒋金虎 提供图片)
如果将智能计算看作是工厂中的一个产品,那么存储便是原料池,而算力则是生产线。张为华教授介绍道,智能技术的迅速发展对算力提出了更高要求:从数据存储角度看,海量的参数需要从海量的训练数据中去学习,这要求底层系统必须具备大规模数据存储能力;从算力的角度来看,随着数据规模的不断提高,智能算法在分析数据时所需要的计算量也越来越大,这要求底层系统必须具备大规模数据计算能力;从软硬件协同的角度来看,智能算法需要快速运算,智能系统需要在多平台中快速部署,这要求底层系统必须加快智能系统的代码执行速度,利用软硬件协同工具链提升智能算法的运算速度,提高智能系统的部署效率。业内普遍认为,智能计算、软硬件协同将是新的计算范式,计算机已从传统的“冯诺依曼”体系架构下“通用算力”向智能化的“专用算力”转变,基于智能算法的软硬件协同计算技术将催生新的发展范式,以实现计算体系架构从单纯的工具型“旧算力”向智能型“新算力”蜕变,从新维度延伸人类的能力范围。
智能计算新范式的基础是高可靠存储
张为华教授指出,数据存储是智能计算的基础。智能计算对数据存储提出了高性能、高可靠放入新需求。所谓高性能,就是适应人类智能特点,解决高并发、实时性的问题,“脑筋要能急转弯”。所谓高可靠,就是大大降低数据丢失风险,智能计算需要的存储要具备“非易失性”,不能出现“短路”“失忆”现象。
位于郑州的网络安全科技馆展出的脑机计算平台(王丹玉 提供图片)
但是,传统的存储设备无法提供高性能的数据访问。例如,机械硬盘的随机访问速度仅为内存设备的十万分之一。今天,各种新型快速存储设备不断涌现,与传统的存储设备相比,它们在顺序访问和随机访问方面的性能有了极大的提高,这降低了智能系统读取数据和写入数据的请求延迟。这就好把使用最频繁的原材料,放在距离车间最近的地方,工厂就能够更快地加工产品,从而缩短了生产周期。同时,智能计算通常按照小批量、随机访问的方式读取数据,这也需要构建新的数据存储系统。
存储设备金字塔 (贺巩山 提供图片)
在数据的可靠性方面,传统的内存设备具有易失性的特点。比如,一旦断电,存储在其中的数据就会丢失,并且无法恢复,相当于人脑出现了“断片”现象。而新型设备拥有断电恢复能力,当突然停电时,会启用内置电源,从而避免数据丢失。为了保证智能计算的数据可靠性,人们在存储架构方面也引入了数据冗余技术。一是多副本技术,将原始数据复制多份,分别存储在不同的机器中。如果某台机器中的某个存储设备发生了故障,只需要从其他的节点中将数据复制过来,就可以恢复丢失的数据。二是纠删码技术,将原始数据切分为大小相同的数据块,而后进行编码排序、制定一个“门牌号码”,如果部分数据块发生故障,可以通过“门牌号码”、通过“左邻右舍”的帮助,找回丢失的那些数据。新型的持久化存储设备和各种各样的数据冗余技术,让智能计算所依赖的数据存储更加可靠。
智能计算新范式的核心是高效能计算硬件
张为华教授认为,智能计算有两个特点。第一个特点是多应用场景兼容,能够根据认知域对抗需求,全方位模拟真实环境的智能化终端连接设备,将用户反馈的信息转发到智能计算中心进行统一处理。第二个特点是增加性能功耗比,随着大数据和智能系统的发展,数据规模迅速膨胀,计算复杂度也越来越高,功耗也越来越大。据世界半导体联盟测算,如果没有技术变革,未来的能源到2035年仅能满足信息基础设施所需。摩尔定律和登纳德缩放定律带来的“免费的午餐”正在逐渐失效,传统的CPU、GPU架构已经不能满足智能系统算力在这两个方面的需求。
认知、信息系统和先进计算 (贺巩山 提供图片)
为了解决多场景兼容问题,科学家们提出了超异构的计算硬件设计,针对各种不同的应用场景设计专门的异构芯片,并对异构架构进行平行扩展。这就类似于不断增加新的定制工具,使得车间可以快速生产各种类型的产品。为了解决性能功耗比问题,科学家们提出了“晶上计算系统”的新范式。传统异构平台都是独立芯片,片上需要额外的面积来支持存储和通信,不但效率低,而且功耗大。为了解决这个问题,科学家们把一个大的计算系统封装在一个大晶圆上,“计算不出圈”,一个晶圆就是一部台式机。同时引入超融合设计的技术,这就好比建造一个大的车间流水线,上道工序加工好的零件直接传给下一个,减少中间储存、运送过程的开销。大晶圆、超融合的设计集成了更多的晶体管,从而可以将多种异构加速引擎、存储设备以及智能网卡融合在一个芯片上。这种方式不仅可以极大地提高芯片的算力,还能够保证在异构加速引擎之间进行高效的数据传输。据介绍,特斯拉公司即将发布的Hardware4.0自动驾驶芯片,就是采用大晶圆、超融合、超异构的方式,大大提升了芯片的性能功耗比,将为大量的业务场景提供更加可靠、更加绿色的算力保证。
超异构和超融合的计算硬件设计 (孔庆灿 提供图片)
智能计算新范式的关键是软硬件协同优化
好马配好鞍,好船配好帆。高可靠的存储、高效能的硬件如果要形成智能化的计算,需要进行软硬件的协同优化,通过软硬件的优化适配,使整个计算系统形成“1+1>2”的效应,把沉睡在“系统”深处的算力唤醒,大幅提升计算效能。智能计算的发展主要对软硬件协同有两个需求,一是提高代码的开发效率,缩短应用的开发周期,降低人力的投入成本;二是提高代码的生成和执行效率,让同样的程序运行的更快更流畅。
软硬件协同优化的构想 (孔庆灿 提供图片)
实现软硬件协同优化,需要“三大利器”。一是工具链,针对不同的领域提供统一的抽象接口,针对多应用、多领域定制计算资源和存储资源,让更多的用户、更加方便的利用好底层硬件的算力。二是优化库,能够通过跨架构的统一编程模型来支持超异构芯片的发展。三是编译器,实现不同应用在特定硬件上的特定优化。如今,编译器的层次越来越多:最上层可以针对不同领域提供领域专用语言,帮助开发人员快速编写高效代码;中间层会支持不同粒度的优化方式,提供自动调优机制;最下层可以针对多种硬件平台进行专门优化和代码生成。编译后的应用能够充分利用存储资源和计算资源,保证了应用的高效执行。
张为华教授指出,未来认知域与智能系统之间的耦合度将越来越高,二者之间的交互活动将会产生无法预计的数据量,对存储、算力、场景兼容性的要求越来越高。解决这些难题的核心还是要推动计算范式的变革,实现在软硬件协同计算、协同优化方面的压强突破、自主创新。第一,硬件系统将进一步向超异构、超融合和存算通信等多维一体的方向发展,从而实现更高的处理效率、数据访问性能和计算功耗比。第二,软硬件协同设计工具链将成为软硬件协同创新和优化的核心,为灵活适配更多、更复杂的场景,软件定义的因素将会越来越多。第三,系统软件需要高效地管理各种硬件资源,提供高可扩展性,支持多种资源属性和场景的有效隔离。第四,要有更加完备的跨平台、跨架构的编译技术,以便支持智能系统在不同平台中的快速部署,同时有效兼容已有生态。“无计算不智能”,智能计算新范式的优势如何转化为认知对抗的胜势,还需要人们继续突破软硬件协同计算中的诸多瓶颈问题,以大幅提高计算的效能。
本文首发光明日报客户端,全媒体记者蔡侗辰,通讯员贺巩山。