国科金发计〔2025〕12号
国家自然科学基金委员会现发布可解释、可通用的下一代人工智能方法重大研究计划2025年度项目指南,请申请人及依托单位按项目指南所述要求和注意事项申请。
国家自然科学基金委员会
2025年1月24日
可解释、可通用的下一代人工智能方法
重大研究计划2025年度项目指南
可解释、可通用的下一代人工智能方法重大研究计划面向人工智能发展国家重大战略需求,以人工智能的基础科学问题为核心,发展人工智能新方法体系,促进我国人工智能基础研究和人才培养,支撑我国在新一轮国际科技竞争中的主导地位。
一、科学目标
本重大研究计划面向以深度学习为代表的人工智能方法鲁棒性差、可解释性差、对数据的依赖性强等基础科学问题,挖掘机器学习的基本原理,发展可解释、可通用的下一代人工智能方法,并推动人工智能方法在科学领域的创新应用。
二、核心科学问题
本重大研究计划针对可解释、可通用的下一代人工智能方法的基础科学问题,围绕以下三个核心科学问题开展研究。
(一)深度学习的基本原理。
深入挖掘深度学习模型对超参数的依赖关系,理解深度学习背后的工作原理,建立深度学习方法的逼近理论、泛化误差分析理论和优化算法的收敛性理论。
(二)可解释、可通用的下一代人工智能方法。
通过规则与学习结合的方式,建立高精度、可解释、可通用且不依赖大量标注数据的人工智能新方法。开发下一代人工智能方法需要的数据库和模型训练平台,完善下一代人工智能方法驱动的基础设施。
(三)面向科学领域的下一代人工智能方法的应用。
发展新物理模型和算法,建设开源科学数据库、知识库、物理模型库和算法库,推动人工智能新方法在解决科学领域复杂问题上的示范性应用。
三、2025年度资助研究方向
(一)培育项目。
围绕核心科学问题,以总体科学目标为牵引,拟以培育项目的方式资助探索性强、选题新颖、前期研究基础较好的申请项目,研究方向如下:
1. 神经网络的新架构和新的预训练或自监督学习方法。
针对图像、视频、图、流场等数据,发展更高效的神经网络新架构、预训练或自监督学习方法,并在真实数据集上进行验证。
2. 深度学习的基础理论。
研究神经网络的函数空间理论及误差分析。研究神经网络非线性训练过程中的重要现象,包括顿悟(grokking)、稳定性边缘(edge of stability)、损失尖峰(loss spike)和凝聚现象(condensation),分析损失景观的嵌入结构、训练超参数、凝聚、正则化技术等对Transformer、Mamba等架构的样本效率、分布外检测、泛化能力、推理性能的影响。
3. 大模型的基础问题。
研究多任务、多数据、大模型的基础问题,包括但不限于大模型的表示理论、泛化理论、样本效率、大模型训练的稳定性、标度率(scaling law)、涌现等现象;研究大模型的记忆灾难(curse of memory)问题;研究大模型的思维链(Chain of Thoughts)、多步推理、上下文学习(In-Context learning)、推理外推能力(如length generalization)等的机制。
4. 以数据为中心的机器学习。
针对大模型数据侧的获取成本和效率问题,剖析数据生成模型的优化与泛化过程,加速生成模型的训练和推理;针对训练数据的质量和数量问题,设计多样化和高质量的数据生成方法,提出高效的数据选择和配比策略,探索数据与模型协同迭代优化的方式,加速通用大模型的训练。
5. 科学领域的人工智能方法与理论。
针对典型的科学领域应用场景,如核聚变、药物研发、材料设计、电子多体等问题,发展人工智能与物理、化学、生物等基础理论和模型融合的方法,建立可通用的跨尺度人工智能辅助计算理论和方法,解决典型复杂正反问题。
(二)重点支持项目。
围绕核心科学问题,以总体科学目标为牵引,拟以重点支持项目的方式资助前期研究成果积累较好、对总体科学目标在理论和关键技术上能发挥推动作用、具备产学研用基础的申请项目,研究方向如下:
1.融合逻辑和深度学习的推理方法。
通过融合逻辑方法和深度学习方法,提升人工智能系统的可靠性与处理复杂推理问题的能力。通过构建形式化数学数据库,优化机器翻译技术与证明算法,实现高度自动化的定理证明,建立高度严谨的推理模型。
2. 融合物理与人工智能的几何生成。
融合物理仿真与深度学习方法,实现面向多物理场微几何结构的基础生成模型;通过建立形式化与BREP表示的计算机辅助几何(CAD)模型数据库,实现功能描述准确、高精度CAD模型自动生成,构建高质量的几何资产;增强从CAD模型生成四面体、四边形、高阶网格的鲁棒性,实现物理仿真稳定性与精度的提升。
3. 新一代脑启发的人工智能。
针对生物神经元的节能特性与多样化结构,在生物神经元与人工神经元之间建立简洁高效的映射,使人工神经元具有生物神经元的能量优化与树突非线性计算功能,并提出统一的能量优化算法框架。结合神经元网络的连接结构与脑区特性,设计生物神经元特性约束和基于时空信息嵌入的人工神经网络模型,实现记忆、决策等高级认知功能。实现不少于3种生物与人工神经元的映射及不少于3种树突计算功能,与现有映射相比,实现精度、性能与可解释性的提升。
4.类人认知学习框架。
探索类人认知学习框架,通过智能体主动感知和交互、模型自主学习和迭代更新,提升系统的智能化水平,解决具身智能体在复杂物理环境下的交互决策难题,为因果模型构建、物理常识生成等具身智能任务提供支撑。
5.物理过程驱动的多智能体仿真场景可信生成。
构建基于物理原理驱动的场景模型,实现高度逼真的环境动态模拟;整合多模态信息,增强智能体与环境的交互,确保仿真实体与现实世界的特性和行为相匹配;建立完善的仿真数据可信度评估体系,确保仿真场景的可靠性,为复杂系统研究和决策提供坚实的虚拟基础。
6. 可解释的人工智能方法及其在化学反应复杂体系中的应用。
发展基于深度学习与物理模型融合的可解释人工智能方法,解析和构建化学反应网络,揭示复杂化学反应体系的微观机理与表界面作用规律,推动可解释的人工智能方法在能源催化、合成化学和合成生物学等重要领域的落地应用。
7. 人工智能驱动的虚拟细胞研究。
基于多组学数据和人工智能方法,发展虚拟细胞技术,模拟细胞动态生命过程,解析细胞互作原理,预测生物体对扰动的复杂响应。具体包括:1)虚拟单细胞:针对酵母、细胞系等典型情景,通过多组学数据构建多尺度基因调控与信号通路网络模型,动态预测细胞行为,实现合成生物学或药物筛选应用;2)虚拟生物体:对线虫、胚胎等典型场景,通过影像学和组学数据,构建多细胞相互作用关系和时空动态变化模型,揭示生物体的生物学机制。
8. 罕见病诊断决策大模型。
建立大规模罕见病临床和遗传信息数据库,覆盖基因和临床表现等多维度信息,结合多模态数据,构建可解释的罕见病诊断决策大模型,为罕见病诊断和治疗提供关键依据。
9. 基于多模态大模型的耐受极端环境生物元件设计。
基于极端环境微生物数据,构建融合序列、结构与功能的蛋白质和核酸序列多模态预训练大模型;分析重要生物元件与环境适应性、代谢功能等的联系,构建元件对极端环境适应度的预测模型;设计开发耐受高温、高压、极端pH的蛋白质和核酸等功能元件并接受湿实验验证,推动其在工业、医药等领域的产业化应用落地。
(三)集成项目。
本年度拟遴选具有重大应用价值和良好研究基础的研究方向进行集成资助,研究方向如下:
1.记忆与推理分离、分层的通用大模型。
设计记忆与推理分离、分层的通用大模型新架构,构建推理数据集,研究大模型的基础理论及训练方法。具体包括:1)探索记忆与推理分离的模型架构,实现可扩展、可学习、高压缩、分布式、分层的记忆存储,设计存算高效的新型训练方法,通过从头预训练大模型(不少于7B参数,1T Tokens)验证新架构与新训练方法的有效性;2)实现文本推理数据的自动提取,自动构建自然语言推理数据和形式化数学定理数据库;3)阐明Next-Token Prediction训练范式有效性的内在机制,研究超参数和模型复杂度等对大模型推理能力的影响。
2. 结构材料构效关系的构筑方法与应用。
研究结构材料成分、组织结构、工艺等知识编码表示方法,发展符号回归和深度学习等材料知识构筑算法,构建物理意义明确的典型结构材料构效关系数学表达式或经验模型;研究可解释材料特征工程、知识诱导高精度建模、材料因果推理等方法,挖掘多组元成分、复杂工艺、组织结构等对材料性能影响的内禀关系,建立材料数据库、知识库和工艺库;面向新型结构材料研发和生产制造全过程,发展数据和知识双驱动的方法,研发出2-3种高性能典型金属结构材料,并通过工程中试验证。
3. 融合环境-系统-模型的智能操作系统。
针对算力硬件和物理世界设备的泛化与智能化趋势,打破物理环境与智能模型边界,设计环境-系统-模型协同演进的方案。具体包括:1)研究操作系统、人工智能模型、物理环境三方面共同迭代演化方法,保障环境-系统-模型协同演进,相比分离演进整体性能提升50%以上;2)研究面向多样化算力硬件和物理设备的分布式操作系统元架构,支撑不少于5种硬件和设备的高效抽象与适配,相比分离抽象利用效率提升30%以上;3)研究面向复杂物理环境的高可靠分布式数据传输与存储底座,实现物理空间智能元素的韧性互联与实时协同。
四、项目遴选的基本原则
(一)紧密围绕核心科学问题,鼓励基础性和交叉性强的前沿探索,优先支持原创性研究。
(二)优先支持面向发展下一代人工智能新方法或能推动人工智能新方法在科学领域应用的研究项目。
(三)重点支持项目和集成项目应具有良好的研究基础和前期积累,对总体科学目标有直接贡献并发挥支撑作用。
五、2025年度资助计划
拟资助培育项目约15项,直接费用资助强度约为40万元/项,资助期限为3年,培育项目申请书中研究期限应填写“2026年1月1日-2028年12月31日”;拟资助重点支持项目约6项,直接费用资助强度约为300万元/项,资助期限为4年,重点支持项目申请书中研究期限应填写“2026年1月1日-2029年12月31日”;拟资助集成项目约3项,直接费用资助强度为800-1200万元/项,资助期限为4年,集成项目申请书中研究期限应填写“2026年1月1日-2029年12月31日”。
六、申请要求及注意事项
(一)申请条件。
本重大研究计划项目申请人应当具备以下条件:
1. 具有承担基础研究课题的经历;
2. 具有高级专业技术职务(职称)。
在站博士后研究人员、正在攻读研究生学位以及无工作单位或者所在单位不是依托单位的人员不得作为申请人进行申请。
(二)限项申请规定。
执行《2025年度国家自然科学基金项目指南》“申请规定”中限项申请规定的相关要求。
(三)申请注意事项。
申请人和依托单位应当认真阅读并执行本项目指南、《2025年度国家自然科学基金项目指南》和《关于2025年度国家自然科学基金项目申请与结题等有关事项的通告》中相关要求。
1. 本重大研究计划项目实行无纸化申请。申请书提交日期为2025年3月1日-2025年3月20日16时。
(1)申请人应当按照科学基金网络信息系统中重大研究计划项目的填报说明与撰写提纲要求在线填写和提交电子申请书及附件材料。
(2)本重大研究计划旨在紧密围绕核心科学问题,对多学科相关研究进行战略性的方向引导和优势整合,成为一个项目集群。申请人应根据本重大研究计划拟解决的核心科学问题和项目指南公布的拟资助研究方向,自行拟定项目名称、科学目标、研究内容、技术路线和相应的研究经费等。
(3)申请书中的资助类别选择“重大研究计划”,亚类说明选择“培育项目”、“重点支持项目”或“集成项目”,附注说明选择“可解释、可通用的下一代人工智能方法”,受理代码选择T01,根据申请的具体研究内容选择不超过5个申请代码。
培育项目和重点支持项目的合作研究单位不得超过2个,集成项目合作研究单位不得超过4个。集成项目主要参与者必须是项目的实际贡献者,合计人数不超过9人。
(4)申请人在申请书起始部分应明确说明申请符合本项目指南中的资助研究方向,以及对解决本重大研究计划核心科学问题、实现本重大研究计划科学目标的贡献。
如果申请人已经承担与本重大研究计划相关的其他科技计划项目,应当在申请书正文的“研究基础与工作条件”部分论述申请项目与其他相关项目的区别与联系。
2. 依托单位应当按照要求完成依托单位承诺、组织申请以及审核申请材料等工作。在2025年3月20日16时前通过信息系统逐项确认提交本单位电子申请书及附件材料,并于3月21日16时前在线提交本单位项目申请清单。
3. 其他注意事项。
(1)为实现重大研究计划总体科学目标和多学科集成,获得资助的项目负责人应当承诺遵守相关数据和资料管理与共享的规定,项目执行过程中应关注与本重大研究计划其他项目之间的相互支撑关系。
(2)为加强项目的学术交流,促进项目群的形成和多学科交叉与集成,本重大研究计划将每年举办1次资助项目的年度学术交流会,并将不定期地组织相关领域的学术研讨会。获资助项目负责人有义务参加本重大研究计划指导专家组和管理工作组所组织的上述学术交流活动。
(四)咨询方式。
交叉科学部交叉科学一处
联系电话:010-62328382