GPT3是暴力美学巅峰？智源研究院欲开发通用智能图灵测试

澎湃新闻

澎湃新闻官方账号 2020.08.2519:57

关注

原标题：GPT3是暴力美学巅峰？智源研究院欲开发通用智能图灵测试

“GPT-3可以称之为暴力美学的巅峰……英文维基百科的全部内容仅占其训练数据集的0.6%……是一个极其烧钱、极其庞大、极其有算力的系统。”

8月24日，北京智源人工智能研究院在北京举行“人工智能的认知神经基础”重大研究方向发布会。清华大学心理学系教授刘嘉出任该重大研究方向的首席科学家，他在当天的演讲中分析人工智能研究机构Open AI近期发布的生成式语言模型GPT-3。

刘嘉提到，GPT-3通过对大量书面材料集与长篇连载文本的预训练，获取关于世界的知识，将“暴力美学”发挥到极致，然而却无法做到理解、共情、推理等对于人类极为容易的事情。他认为，这种暴力美学无法实现真正的智能，通用智能还需看生物智能。

清华大学心理学系教授刘嘉

刘嘉教授毕业于麻省理工学院脑与认知科学系，获认知神经科学哲学博士学位。现为清华大学基础科学讲席教授，在清华大学心理学系和脑与智能实验室从事教学和科研工作。

北京智源人工智能研究院成立于2018年11月，是在科技部和北京市政府指导和支持下，由北京市科学技术委员会和海淀区政府推动成立的新型研究机构。

暴力美学无法实现真正的智能

GPT-3全称Generative Pre-training Transformer-3，即生成式语言模型，通过对不同的书面材料集与长篇连载文本的预训练，以获取关于世界的知识。GPT-3具有 1750 亿参数，远超此前类似语言模型，参数量较2019年2月发布的GPT-2高两个数量级（GPT-2含15亿参数）。

自Open AI 2020年6月发布该模型起，GPT-3因其强大功能和令人惊叹的测试结果备受关注。它可以实现的功能包括：输入一句自然语言后，模型自动完成编程；对模型描述一种病症，它可以指出是什么疾病并开出药方；甚至询问一些关于人生信仰的问题，模型也可以做出回答。

以上这些强大的功能主要建立在庞大的数据量和巨额投资之上。据刘嘉介绍，GPT-3一次训练的费用是460万美元，训练时间为355个GPU年，即如果以1个GPU衡量，需耗时355年。而包含约600万篇文章的英文维基百科的全部内容仅占其训练数据集的0.6%。

尽管投入巨大，但不少计算机科学家认为GPT-3不具有革命性的变化，不能真正理解语义。

刘嘉谈到，GPT-3模型所做的仅仅是把一些知识链接在一起，但没有理解其含义。例如，当被问到“我的脚有多少只眼睛”时，模型会回答“你的脚有两只眼睛”。

刘嘉评价称，GPT-3 “之所以做出这类不恰当的回答，不是因为训练数据不够，而是没有理解‘眼睛’的概念，也没有相关的常识”。

除了理解能力不足，共情、推理等能力也是目前的人工智能模型难以做到的。“我们没有去教会机器怎么理解、怎么推理，怎么寻找内在关系，找到万事万物背后运行的规则。”

通用智能或需看生物智能

刘嘉介绍，智源研究院此次发布的“认知神经基础”重大研究方向希望能够探索生物智能，将生物智能与人工智能进行融合。他表示，整个“认知神经基础”课题团队，将致力于将神经科学、认知科学和计算科学进行交叉融合，从三个方向向通用人工智能靠近。

刘嘉表示，从认知神经的角度考虑，理解智能有三个层级，硬件层面、表示与算法层面以及计算理论层面；对应到生物智能中，分别是脑神经结构、生物神经网络模型以及认知模型。

课题组将分别从三个层面进行研究：生物基础、网络模型、生物视觉。

其中，北京大学分子医学所教授陈良怡、北京大学心理与认知教授方方将围绕“生物视觉认知的神经基础”，用多种脑成像的方法，探究大脑的精细结构、阐明生物视觉的认知功能和计算架构；

刘嘉将进行“AI的脑解析”，利用认知神经科学的研究方法打开人工智能（深度学习网络）的黑盒子；

北京大学计算机系教授吴思和清华大学医学院及脑与智能实验室研究员宋森将探索“类脑的AI”，基于生物视觉认知的研究成果，构建类脑视觉信息处理的模型与算法。

同时课题组也将构建一个多尺度、多精度、多模态、多认知任务和多模型的生物智能开源开放平台。

刘嘉认为，将生物智能与人工智能进行结合，从而提出一个独立于物理实现层的表征与算法是实现“智能理论”的正确道路。另一方面，当前的弱人工智能的测试主要基于图灵测试，但图灵测试本身是基于行为主义，不可能做到可解释、可信赖；为了定量探究强人工智能，“认知神经科学”课题组将致力于探索开发“通用智能的广义图灵测试”。