什么是AGI
通用人工智能(Artificial General Intelligence,简称AGI),是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念 。AGI研究发展通常涉及众多学科领域,包括计算机科学、认知科学、心理学、神经科学等。
目前通用人工智能AGI的发展仍面临诸多挑战,如跨领域知识的迁移、自主探索与学习、情感与价值观的融入等。除此之外,AGI的伦理、法律和安全问题也引起了广泛关注。展望未来,AGI有望在医疗、教育、科研等领域发挥其重要作用,能极大提升生产效率,改善生活质量。
AGI研究理论
一个统一理论
AGI研究的目标是寻求统一的理论框架解释各种智能现象,并研发具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念的通用智能体 。
两个完备性
通用人工智能系统还需具备AI系统的两个完备性,所谓AI Completeness,指的是:
(1)完备的认知架构(Complete CognitiveArchitecture),即任意一个AI任务都可映射到该架构中解决,并能分析任务的复杂度;
(2)完备的测试环境(Dynamic Environment with Physical and Social Interactions, DEPSI),即可提供任意复杂的物理与社会场景,将人类可能遇到的任务均可在平台上复现。
三个基本特征
实现AGI需要满足三个关键要求:
(1)完成无限任务,包括在复杂动态的物理和社会环境中没有预先定义的任务;
(2)自主定义任务,像人类一样自主产生并完成任务;
(3)由价值驱动,智能体要像人一样由价值V驱动能力U。
当前的人工智能研究还大多集中在数据驱动的统计建模与学习,亟需增进因果推理能力,这是链接智能体的内在价值和外部行动,构成价值-因果-行为链条的关键所在;并开放具身能力,这是智能体能够进入现实世界与人和环境交互,执行并完成任务的基础。而当前的ChatGPT大语言模型还不具备以上这些特征的任何一个。
AGI未来趋势
人工智能的技术前沿将朝着以下四个方向发展。
第一个前沿方向为多模态大模型。
从人类视角出发,人类智能是天然多模态的(眼、耳、鼻、舌、身、嘴),从AI视角出发,视觉,听觉等也可采取与大语言模型相同的方法进行学习,并进一步与语言中的语义进行对齐,实现多模态对齐的智能能力。
第二个前沿方向为视频生成大模型。
文生视频模型SORA将视频生成时长从几秒钟大幅提升到一分钟,且在分辨率、画面真实度、时序一致性等方面都有显著提升。SORA的最大意义是它具备了世界模型的基本特征,虽然仍然存在很多问题,但可以认为SORA学会了画面想象力和分钟级未来预测能力。
第三个前沿方向为具身智能。
具身智能指有身体并支持与物理世界进行交互的智能体,通过多模态大模型处理多种传感数据输入,由大模型生成运动指令对智能体进行驱动,替代传统基于规则或者数学公式的运动驱动方式。具有具身智能的机器人,可以聚集人工智能的三大流派:以神经网络为代表的连接主义,以知识工程为代表的符号主义和控制论相关的行为主义,这预期会带来新的技术突破。
第四个前沿方向是AI4R(AI for Research)。
当前科学发现主要依赖于实验和人脑智慧,而信息技术无论是计算和数据,都只是起到一些辅助和验证的作用。相较于人类,人工智能在记忆力、高维复杂、全视野、推理深度、猜想等方面具有较大优势,是否能以AI为主进行一些科学发现和技术发明,大幅提升人类科学发现的效率,比如主动发现物理学规律、预测蛋白质结构、设计高性能芯片、高效合成新药等。因为人工智能大模型具有全量数据,具备上帝视角,通过深度学习的能力,可以比人向前看更多步数。