薛向阳教授:大模型时代的数据空间抗测绘研究

发布者:仇韵舒发布时间:2023-05-15浏览次数:98



5月14日,大数据研究院副院长薛向阳教授在首届“数据空间”大会“可信服务”分论坛作主题报告“大模型时代的数据空间抗测绘研究”,分析了大模型时代数据空间测绘与抗测绘技术的发展趋势,提出了“资产不可测、数据不可用、模型不泄漏”的总体解决思路和技术路线。据了解,本届“数据空间大会”由中国工程院信息与电子工程学部、国家自然科学基金委员会信息学部指导,合肥综合性国家科学中心数据空间研究院、中国科学院计算技术研究所主办。本届大会设立算力基础设施、未来网络试验、数据场、可信服务、健康数据空间、工业数据空间、金融数据空间等7场分论坛,多维度探讨数据空间发展机遇,赋能产业融合创新发展。




薛向阳教授在报告中指出,随着物联网、移动互联网、在线社交网络的不断发展,信息空间、物理世界和人类社会逐渐形成高度融合的状态,数据是实现三元空间连通耦合的关键。数据空间实在“物理—信息—认知”三域深度交链、相互交织形成的新空间,呈现出跨时空、多尺度、动态关联等特性由传统“以数据为中心向”数据+模型”双轮驱动的范式演进。大数据+大模型既带来“大收益”,也带来“大风险”。




薛向阳教授介绍,数据空间抗测绘技术的核心目标是“资产不可测、数据不可用、模型不泄漏”。通过内生安全理论赋能抗测绘,针对现有数据资产存在固有可测性的内生问题,达到“测不到,测不准,绘不对”的目标。通过构建不可学习样本,让网络数据不可用于训练大模型。针对大模型中存在的数据泄漏问题,通过抗攻击工具与平台的构建,有效保证模型的鲁棒性,防范模型被“窃听”、数据被泄漏等问题。薛教授指出,数据空间抗测绘是一个新兴的研究领域,未来将有广阔的研究前景和应用空间。