人工智能(AI)也可像人类一样,通过智商(IQ)测试,来衡量它到底有多“聪明”。记者从上海脑科学与类脑研究中心获悉,由该中心主办发起的首届机器自动智商测试挑战赛(Machine Automated IQ test challenge, MAIQ’2020)将在今年的国际人工智能大会(IJCAI'2020)上举行。目前,该赛事已开始招募参赛队伍,计划于6月中旬公布决赛入围者。
为何要让人工智能来做人类的智商测试题?该项赛事负责人、上海脑中心教授周熠说,这可以促进人工智能在认知层面的技术融合与发展,同时探索建立认知智能的国际标准,为我国在这一领域争取更多话语权。
后图灵时代,AI智商测试重在考量通用智能
让机器做人类的智商测试,是不是有点无聊?一点也不。事实上,“怎样判断机器拥有智能”“如何评测机器的智能”一直是人工智能领域最重要的几个科学问题之一。
早在上世纪50年代,人工智能之父艾伦·麦席森·图灵就提出了一个划时代的问题:机器能思考吗?他由此提出了著名的“图灵测试”:如果机器可以骗过30%的受试者,让他们误以为面对的是一个人类,那它就达到了拥有智能的标准。
但科学家和工程师们很快就想出了很多投机取巧的方式,让一个个机器通过了图灵测试。人工智能进入“后图灵时代”后,人们又开发出多种测试方法,但都难逃“被欺骗”的命运。“因为这些测试大都偏重某一方面的能力测试,故而机器总能找到办法通过。”周熠说,人类智能是一种通用智能,一个人既能画画、跳舞,也能演讲、下棋,若要让机器同时做到这么多事,现在的人工智能可能就力所不能及了。
“真要通过人类智商测试,工程师需要综合运用机器学习、知识表示与推理、计算机视觉、自然语言处理、神经网络和符号推理等多个领域的技术。”周熠认为,这对现有AI技术的发展将是一个有力的推动。“这方面的研究在学界已持续多年,现在我们率先提出严肃对待这一测试,并以此发起一项国际赛事,同时开始逐步探索建立认知智能的国际标准”。
从感知到认知,用竞赛促进AI细分领域发展
在图形中找规律、理解一些话语的意思、计算数列……在普通人的印象中,这些题目对机器大脑而言,应该都非常简单吧。可实际并非如此。
上海脑中心的研究人员曾通过测试发现,尽管人类智商测试题看上去简单,但在告知题型的前提下,机器在语言类测试上的表现基本可与人类持平,而在完成数字和图像测试方面的表现,与人类差距相当明显。如果不告知机器题型呢?“结果可能会更不理想。”周熠说,测试所显示出的机器大脑短板,正是人工智能需要挑战与发展的方向。这也成为上海脑中心发起机器智能测试比赛的初衷。
实际上,在人工智能发展历程中,通过比赛来促进细分领域发展的先例比比皆是。比如,始于1997年的机器人世界杯赛事RoboCup,积极推动了全球自主机器人的发展。又如,ImageNet大规模视觉识别挑战赛举办十年来,使AI对于图像识别的准确率提高了近十倍。
尽管学界对于如何测试AI智商还存在不同看法,但周熠认为,用人类IQ测试题来考量AI,这对推动目前人工智能的发展相当有利。他表示,目前的人工智能虽然在感知层面做得较好,但在认知层面却相当欠缺,“尤其要让机器运用和推理知识、理解认知对象,依然十分困难”。
赛题来自人类IQ测试题,解题涉及各种AI技术
自3月10日张榜招募至今,已有来自全球不同国家和地区的20支队伍报名参加首届机器自动智商测试挑战赛。
据介绍,入围决赛的选手将在国际人工智能大会2020会议现场参加决赛,最终排名也会在现场公布。不过,鉴于目前新冠肺炎疫情在全球的大流行,届时日本是否会取消国际人工智能大会,还是一个未知数。主办方表示,如果大会取消,那么所有比赛将移至线上。
周熠透露,机器自动智商测试挑战赛将包含三类IQ测试题,分别是语言理解、图像推理和序列推理。这其中的所有问题都是从针对人类的IQ测试题中收集而来,选手可开发程序来自动解决这些测试题。
另外,为更好促进AI认知领域发展,赛事组委会建议决赛选手开放他们的源代码,同时提交一篇描述其系统工作原理的论文,“冠亚军团队必须至少完成上述两者之一”。
作者:许琦敏
编辑:李晨琰
责任编辑:任荃
*文汇独家稿件,转载请注明出处。