英国威廉希尔官网张洳源课题组提出脑启发的人工智能抽象视觉推理模型
2025年10月22日,人工智能领域顶级期刊IEEE Transactions on Pattern Analysis and Machine Intelligence(中科院一区TOP, CCF-A类期刊, 5-year IF=20.4)以已接受论文预印本的形式刊出了我们副研究员张洳源课题组的新研究“Neural prediction errors as a unified cue for abstract visual reasoning”。这项研究由张洳源课题组牵头,联合北京大学和中山大学科研团队,为人工智能模型如何基于抽象规则进行高效视觉推理提供了新见解。智能(Intelligence)到底是什么不同学科往往有不同的定义。一个普遍的共识是通用人工智能可以归纳总结事务之间的抽象关系,并在此基础上进行复杂推理。人往往表现出较强的归纳总结和举一反三的能力。相比之下,深度神经网络长期以来因其在抽象视觉推理(Abstract Visual Reasoning, AVR)方面的局限性而受到批评。张洳源课题组一直致力于解决基于人脑瑞文智力测验的抽象视觉推理问题,这不仅契合了当前心理学和认知科学对智力的定义,也试图克服当前深度模型抽象推理难的痛点。张洳源和其合作团队,在课题组前期工作的基础上(ICML, 2023;IJCAI, 2023),借鉴神经科学中广为人知的“预测误差”(Prediction Error)概念,创新提出预测误差可以作为一个统一机制,同时支持监督学习与自监督学习在AVR任务中的实现。在提出的监督学习模型中,AVR被建模为一个“预测—匹配”过程,其核心在于由抽象规则生成的预测特征与推理情境中候选特征之间的差异(即预测误差)。在自监督模型中,预测误差作为核心成分,将学习与推理过程统一起来。无论是监督还是自监督的基于预测的模型,都在多个AVR数据集和任务条件下达到了当前最优性能。尤为值得注意的是,在监督模型的训练过程中,层级化预测误差会自动下降,这一涌现现象与生物学习中多巴胺信号逐渐减弱的规律高度相似。这些发现强调了预测误差在抽象视觉推理中的关键作用,并突显了利用神经科学理论推动人工智能中高级认知计算模型发展的潜力。本文第一作者是中山大学杨凌霄副教授。williamhill官网张洳源副研究员和北京大学方方教授为通讯作者。文章共同作者包括了中山大学谢晓华教授和郑伟诗教授。本项目受到国家自然科学基金(T2421004, 62206316, 32441102, 31930053)、上海市教委专项基金(2024AIZD014)、广东省信息安全技术重点实验室(2023B1212060026)和科技创新2030重大项目 (2022ZD0204802) 的支持。Yang, L, Xie, X., Zheng, W., Fang, F.*, Zhang, R.Y.*. Neural prediction error as a unified cue of abstract visual reasoning. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), doi: 10.1109/TPAMI.2025.3623461.论文链接: https://ieeexplore.ieee.org/document/11207515
2025-10-28