孙凝晖院士论数据中心技术的发展


发布日期:2022-07-19 浏览次数:10

2022711日,中国工程院院士、中科院计算所研究员兼学术所长、计算机体系结构国家重点实验室主任孙凝晖院士在复旦大学大数据研究院的讲座“数据中心技术的发展”顺利举办。大数据研究院院长、中国工程院邬江兴院士、大数据研究院教师、博士研究生、硕士研究生通过线上会议、多地连接的形式共同参加了本次讲座。本次会议由薛向阳教授主持。

孙院士首先介绍了数据中心的发展历程,信息化按照负载特征可划分为从DC 1.0DC 3.0的三个阶段。DC 1.0是数据中心的初级阶段,机器满负载运行,存在扩展性瓶颈。让机器“算得快”的主要手段是提高并行度。随着PC和互联网的普及,数据中心的发展进入DC 2.0阶段,人与人、人与机、机与机需要(透过网络)进行交互和移动数据。负载特征从计算型转化为事务型(Transaction),需求是让“数据移动快”,数据中心的系统重点是互联技术与虚拟化技术。目前,我们已经进入人机物三元融合(Embodiment)的DC 3.0阶段。计算机需要处理物联网、云计算和大数据产生的海量数据,出现了新的负载类型——通量型负载(Throughput,其特征是负载量大、特征多样并且数据重用少。由于资源竞争严重导致性能下降,“算的多”已成为新的挑战。

云数据中心的系统技术挑战是通量型负载带来的资源竞争的不确定性。无序共享会带来性能干扰,对共享资源的强竞争给体系结构引入不确定性,主要包含三个类型:访存粒度小(计算/访存比低)、访存特征随机(访存模式不规则)和数据通路冲突严重(访存并发度大)。在资源竞争冲突时,系统实际性能会急剧下降,成为体系结构硬件设计的挑战。另一方面,通过软件调度能够降低可预测的竞争,但无法降低不可预测的竞争,不能彻底解决问题。因此,通量型负载需要可变的计算机体系结构与之适应。为形成高通量系统的设计准则,提出使用系统熵来刻画系统的不确定性。针对处理器结构如何可变的问题,方法是对新应用“计算-访存模式”进行抽象,研制四类基本型软硬件协处理加速部件,从计算和访存两个方面入手,提高云应用的并行度和执行效率。

最后,孙院士对数据中心技术的发展进行了总结:针对计算共享环境下,计算-访存等数据通路竞争引起的程序运行的不确定性与性能的不可预测提出高通量技术,通过标签化机制与可控程序控制机制,实现可变的数据通路结构,增强了对它的调控能力,提高了系统效率和应用服务质量。同时,孙院士还指出了云原生大数据分析引擎面临的新挑战,并对未来低熵数据中心DC 4.0的发展趋势进行了分析和预测。

报告结束后,孙院士和大数据研究院的师生就数据中心技术在大数据和人工智能领域的应用展开了热烈的讨论,并为大家提供了更高维度的建议和启发。复旦大学大数据研究院长邬江兴院士对孙院士讲座的内容给予了高度评价,并就“存算一体”、“存算分离”以及“模拟计算”等问题与孙院士进行了深刻地探讨和解读。孙院士的讲座,不仅让在场的师生们开阔了对数据中心技术的认知,也对大数据研究院今后在计算机体系结构方面的发展具有非常积极的指导意义。