在认知域,究竟谁最具有“颠覆性意义”,谁能成为新一轮变革浪潮的引领者?我们将通过“认知域科技创新系列谈”活动,汇聚各方专家学者的意见,聚焦认知域工程技术范式变革,共同探讨认知域技术创新的战略重点、发展策略、实施路径,为国家科技创新建言献策。
随着互联网和网络通信、新媒体等信息技术的飞速发展,认知域已悄然成为继体力对抗、火力和机动力对抗、信息对抗之后,又一个全新的对抗领域。传统的认知空间是由人类意识、思维、情感构成的虚拟世界,但随着人工智能技术的发展,人类的认知可以通过信息技术进行抽象、描述,用计算机和网络构建出一个和人类认知空间相平行的新系统,他可以像人一样思考,帮助人们推理、预测、判断。当“人机物”实现深度互联后,一个新的领域——认知域应运而生。在这个领域的对抗博弈中,最关键、最核心的竞争是计算能力的竞争。换而言之,计算能力决定了认知域的战斗力。算力对认知域对抗究竟有哪些作用和影响?认知域对抗对未来算力的发展有哪些新需求?带着这些问题,记者采访了国家超级计算郑州中心执行主任商建东。
多算胜,少算不胜
认知对抗是在海量数据、算法、算力支撑下的战略战役行动,是在认知域中竞争博弈、相互较量、克敌制胜的主要手段。认知对抗,不但需要海量数据、智能算法、大规模硬件,更需要高效的“算力”。
商建东主任认为,计算力在认知对抗中起着重要的基础支撑作用,可谓“算力强者胜”。比如,近期俄乌局势冲突加剧,大量军事设施照片被曝光以及俄莫斯科号被击沉的消息,都是首先通过遥感卫星图像处理后得到证实,其中遥感卫星图像的处理就需要底层算力的支持。对卫星图像的判识,反映的是人们对客观世界的认知能力。
对认知域而言,更深层次工作就是自然语言处理,因为机器只有理解人类的语言,才能像人类一样进行思考、交流。对于自然语言处理,需要建立超大的模型,这些模型都需要超强的算力。2020年OpenAI发布了具有1750亿参数的自然语言处理巨量模型GPT-3,其所需的算力达到了3640PetaFlop/s-day。从更直观的角度来看,使用一块计算性能为12TFlops的GPU训练一个GPT-3模型需要运行355年,即使使用10000块GPU,也要花费30天才能完成训练。2021年浪潮人工智能研究院推出了中文巨量语言模型,其参数达到了2457亿,是GPT-3参数量的1.404倍,所需算力达到了4095PetaFlop/s-day。DeepMind的Gopher于2021年底推出,将参数个数提高到2800亿,是GPT-3参数量的1.6倍。显然,智能技术的发展、认知能力的提升对算力的要求越来越高,需要算力来为其提供“动力”。
如果把自然语言处理比喻成马拉松,参数、算力相当于路程和速度,在路程大量增加的同时,保证规定时间到达目的地,速度的提升是关键。同样,对于自然语言处理模型来说,参数突破千亿级别,算力起到了至关重要的作用。还有目前比较火的元宇宙,元宇宙其实是一个可以进行三维呈现、可以具象化的认知空间,其中包含的物理计算、图像渲染、人工智能、动作捕捉、触觉反馈等带来海量数据计算和传输需求,都需要超强的算力支持。
有“神机”方有“妙算”
商建东主任指出,算力的获取主要依靠超级计算机。超级计算机系统作为一个时代计算技术工艺最先进、计算能力最领先、造价最昂贵的大型系统性基础科研设施,被誉为计算机领域皇冠上的明珠,可以应用于气候模拟、灾害预报、地质模拟、工业设计、材料研究、新药研制、智慧城市、基因研究等众多领域。
(图为国家超算郑州中心的研发团队 付玉 供图)
当前,超级计算机系统提供的超强算力模拟,已成为继理论科学、实验验证之后人类认知及探索世界的第三种有效手段。算力已成为国家与国家之间竞争与博弈的焦点,在保障国家安全和推动国民经济快速发展方面有着举足轻重的作用。“十三五”期间,“神威”“天河”“曙光”三大超算研制单位相继通过了E级原型系统的验证,标志着我国已经具备了研制E级超级计算机系统的能力。科学研究对计算能力的需求是无止境的,未来,后E级计算时代的技术发展与革新,将为人类科学探索提供大规模更高效的算力。
目前,基于超级计算机我国已经建立了“脑级人工智能模型”,上百万亿个参数的AI模型可用于人工智能的各种应用,为认知域对抗提供支撑。Meta的AI研究团队正在开发一个AI超级计算机,希望能帮助研究人员开发像人脑一样思考的人工智能模型,支持元宇宙中丰富的多维体验,例如,为讲不同语言的人提供实时语音翻译,帮助他们在工作中或者AR游戏中进行有效沟通、无缝合作。由于机器学习没有传统超级计算机任务对准确性的要求高,所以AI超级计算机不一定能与传统超级计算机进行直接比较,但据Meta给出的数据显示,与其传统生产和研究基础设施相比,AI超级计算机运行计算机视觉工作流程的速度高达 20 倍。因此,AI超级计算机在机器学习、AI模型训练方面比传统超级计算机更有优势,可以帮助研究人员建立跨数百种语言工作的 AI 模型,助力各大平台更高效的开展相关智能化业务,比如用于用户的文本分析,用户发布的图像或者视频的审核等。
在大数据分析与运用、超级计算能力、自然语言处理能力以及新一代网络通信能力大幅提高的基础上,利用超级计算机,将有力推动人类大脑认知、思维模式、习惯偏好、认知框架乃至神经网络、脑控技术等方面的研究,进而计算模拟人们的认知、心理、行为以及意识传播等等。
算无遗策还需创新
随着算力实现方式的不断创新,除了传统高性能计算和人工智能等技术的融合之外,未来多元异构协同计算、“经典+量子”协同计算、云计算等的融合都可能成为常态,融合成为超算未来发展的一大趋势。近年来,以量子计算为代表的新型计算技术取得了突破性的进展,针对特定计算任务表现出了强大的计算加速能力,已初步显现未来提升计算能力的巨大潜力。量子计算与经典计算最大的区别在于存储、运算的对象不同。经典计算通过控制晶体管电压的高低来处理比特信息,即完成“0”或“1”的信息处理。量子计算则采用量子比特作为基本单元存储信息,处于“0”和“1”之间的叠加状态。相较于经典计算通过控制电路的开关来处理信息,量子计算可以利用粒子量子态的叠加与纠缠的特性,凭借其天然的并行运算能力,在特定领域中可实现指数级的算力提升。本质上而言,量子计算中的“0”“1”叠加状态更符合人类思维模式和认知特征。
商建东主任指出,国内已经开始探索量子计算在认知领域的应用场景,借用量子理论中的概念来帮助心理学家更好地预测人类的决策。比如,我们日常生活中最常用到的算法推荐。目前,算法推荐服务已经融入到我们日常生活的方方面面,可以更加精准地向用户推送商品、服务、信息等。算法推荐在给人们生活带来便利的同时,也出现了算法歧视、算法垄断以及算法侵害用户权利的问题,甚至出现算法控制舆论等危害国家安全的问题。像一些平台采用完全由机器主导的算法模型,为迎合用户喜好,追求利益最大化,往往会推送低俗、猎奇等刺激人感官的内容,吸引用户点击,甚至设置诱导用户沉迷、过度消费的算法模型,诱导未成年人沉迷推荐的网络内容而无法自拔。如何让主流价值纾解“算法焦虑”和“流量焦虑”,更好地用主流价值观打造主流算法,让正能量导入大流量,构建健康活跃的新媒体内容生态。为此,国家数学工程和先进计算实验室与郑州大学国家超级计算郑州中心合作,将量子信息技术与超级算力融合应用于实际推荐系统中,推出了“主流媒体算法—新蓝算法”。其利用量子启发算法,运用分布式架构技术、大数据分析和人工智能技术,结合全站搜索引擎,根据用户行为,分析群体画像“素描”和“情绪”,加上人工干预模板,综合考虑多种维度,提高推荐效率、精准度和个性化,增加用户阅读兴趣及用户粘度,并引入主流价值观,推动算法治理技术创新,在量子技术与认知技术融合创新上做出了有益的尝试。
商建东预测,超级算力应用于认知科学领域,对深化认知域的实证趋向具有重要意义,算力就是感知力、洞察力、创造力、认知力。超算本身就具有“算天算地算人”的使命,在经典超级计算机系统算力的基础保障及量子计算等新兴算力的加持下,在领域专用软硬件协同计算等新的计算范式推动下,实现诸如“经典+量子”的算力融合,并真正地、有效地与人的认知交汇在一起,将会共同推动认知科学的日趋成熟,促进人类认知科学的飞跃发展。
(光明日报全媒体记者 蔡侗辰 通讯员 韩林)