猴子究竟有多聪明?科学家发现,在吃豆人游戏中,它不仅会简单决策,还能进行分层决策,甚至将不同策略组合成复杂策略,来解决难度更高的关卡。
日前,《eLife》在线发表了来自中国科学家的题为《猕猴在吃豆人游戏中的分层组合策略》的研究论文。该论文将复杂的行为范式和人工智能建模结合,定量研究了猕猴解决复杂问题的启发式行为策略特点,为理解大脑实现高级认知功能的计算机制提供了全新方法和重要启发。
(图片来源:jpbeta.cc)
日常生活中,人们大部分的重要目标通常都无法仅用简单决策来实现,往往需要通过设计一系列缜密的基础策略组合来实现。
研究动物的复杂行为和潜在的神经机制,是神经科学和认知科学领域持续受到关注的一个科学问题,但目前大部分的动物行为范式复杂程度,都不足以支持如此复杂的高级认知策略研究。
中国科学院脑科学与智能技术卓越创新中心(神经科学研究所)、灵长类神经生物学国家重点实验室杨天明研究组,设计了一种新颖有趣的实验范式——吃豆人游戏,并且训练猕猴学会使用摇杆完成该游戏范式的主要任务。
▲(A)吃豆人行为范式。(B) 猕猴用分层决策的策略解决吃豆人任务。该策略在最低级别,为操纵杆的移动做出决定:向上、向下、向左或向右。在中间层,在策略基组之间进行选择。在更高的层次上,可以将简单的策略拼凑成更复杂的复合策略基组。
为解决这些问题,该研究改编经典街机游戏吃豆人(图A),并训练猕猴学会使用操纵杆来控制吃豆人在一个封闭的迷宫中运动收集食物,猕猴避开敌人追击将获得实时果汁作为奖励。
在经过训练后,猕猴就能够理解游戏中各个元素和奖励惩罚之前的关联,并依次相应地做出连续的运动抉择,来躲避敌人的追击,获取更多的奖励,甚至在特定规则下对敌人实现反杀。
这么复杂的游戏,为何会让猕猴有兴趣学习并不断进阶?杨天明认为,该游戏虽然高度动态且复杂,但其本质上还是比较接近于动物野外觅食,贴近动物天性,“这或许是该研究成功训练动物的关键要素”。
为定量地描述猕猴行为策略的特点,研究人员利用机器学习和统计方法,动态拟合匹配游戏玩法与多个智能策略模型,该模型对猕猴手柄运动的预测准确率能够达到90%以上。
结果发现,猕猴会通过使用分而治之的启发式方法,在每个时间只关注游戏的一个子任务,分布式地解决这些问题,从而实现对游戏总体目标的优化。
更令人感到吃惊的是,研究发现猕猴能够在时序上组合一些简单策略基组,构建更为复杂的复合策略,来处理特定的更有挑战性的任务。
以上的研究结果表明,猕猴能够优化掌握一套策略基组,并采用分层决策的方式来解决十分复杂的任务(图B)。
本研究着眼于系统认知神经科学和人工智能广泛关注的交叉领域,将复杂的行为范式和严谨的计算建模进行结合,为未来研究灵长类动物的高级认知提供了重要的实验证据和新颖的分析方法。
作者:许琦敏
图片:受访者提供
责任编辑:任荃
*文汇独家稿件,转载请注明出处。