AGI 或许会成为人类历史上最重要的技术发展之一,但遗憾的是,这个术语的定义一直模糊不清。
近日,一篇由多位名校学者共同创作的学术论文探讨了 AGI 的定义。他们基于 Cattell-Horn-Carroll(CHC) 理论,提出了一个可量化的框架,将 AGI 分解为十个核心认知领域,包括推理、记忆和感知,并调整了现有的人类心理测量方法以评估人工智能系统。
该框架揭示了当代模型中高度“参差不齐”的认知特征。尽管当前的人工智能系统在知识密集型领域表现出色,但它们在基础认知机制方面存在严重缺陷,尤其是在长期记忆存储方面。
本文作者来自加州大学伯克利分校、康奈尔大学、卡耐基梅隆大学等知名院校。
可量化的评估框架
研究框架包含十个核心认知组件,源自 CHC 的广泛能力,并按 10% 的权重分配,以优先考虑广度并涵盖主要的认知领域:
- 常识(K)
- 阅读和写作能力(RW)
- 数学能力(M)
- 推理能力(R)
- 工作记忆(WM)
- 长期记忆存储(MS)
- 长期记忆检索(MR)
- 视觉处理(V)
- 听觉处理(A)
- 速度(S)
这种操作化提供了整体和多模式(文本、视觉、听觉)的评估,作可以查明当前人工智能系统的优势和严重弱点。
更重要的是,该定义关注的是受过良好教育的个体通常具备的能力,而不是所有受过良好教育的个体知识和技能的超人集合。
基础认知缺陷
该框架揭示,当代人工智能系统表现出高度不均衡或“参差不齐”的认知特征。虽然模型在利用大量训练数据的领域(例如常识(K)、阅读和写作(RW)以及数学能力(M))表现出很高的熟练程度,但它们同时在基础认知机制方面存在严重缺陷。
这种不平衡的发展凸显了阻碍通用人工智能(AGI)发展的具体瓶颈。长期记忆存储或许是最显著的瓶颈,在当前模型中得分接近 0%。
同样,视觉推理能力的缺陷也限制了人工智能代理与复杂数字环境交互的能力。
当前人工智能能力参差不齐,常常导致“能力扭曲”,即利用某些领域的优势来弥补其他领域的严重弱点。这些变通方法掩盖了潜在的局限性,并可能造成一种脆弱的通用能力幻觉。
某些具有战略意义的人工智能可能在 AGI 之前或之后出现。一些特别值得关注的类型有包括:多阶网络活动 AI、自我维持 AI、超级智能 AI 等等。
研究人员表示,AGI 的定义是:一种能够达到或超过受过良好教育的成年人的认知多样性和熟练程度的人工智能。
不同于 OpenAI 和微软对于 AGI 的定义,该论文对 AGI 的定义是人类水平的 AI,而不是具有经济价值的 AI,也不是经济水平的 AI。
参考资料:
https://arxiv.org/abs/2510.18212
【免责声明】本站所刊内容仅代表作者本人观点,与机器人网站无关。机器人网站对文中陈述、观点判断保持中立。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如有侵权,请联系我们删除。
本文地址:http://www.jiqiren.org.cn/tt/1180.html
