2023年第20周 (05-15 ~ 05-21)

人工神经网络能否实现AGI(通用人工智能)

观看 AlphaGo 的纪录片,回顾 2016 年 AlphaGo 与 李世石的围棋对战,仍然让我感到激动。

IBM开发的 深蓝 战胜了国际象棋大师卡斯帕罗夫,使用的是穷举法。与国际象棋不同,围棋的棋盘规模更大,规则简单,可能的走法空间非常大,这导致穷举法无法在合理的时间内计算出最优解。
由 DeepMind 开发的 AlphaGo 战胜围棋世界冠军李世石,和战胜柯洁的 AlphaMaster 都是基于人工神经网络,这使得它们不仅能在局部战术上计算多步走棋,更能学习和判断全盘局势。

如今,GPT 3.5 等大型语言模型具备阅读、理解和推理能力。Midjourney 和 StableDiffusion 扩散模型具有绘画能力,OpenAI 的 Whisper 具有de 语音识别能力,Meta 的 Segment-anything 对图像语义分割的能力,单项智能已经等于甚至超过了一般人类,而这些都是基于深度学习的人工神经网络。

当单个跨模态(多模态)的大型神经网络模型逐步具备所有这些能力,“脑容量”继续扩大,其智能肯定会一步步向人类靠近。但是否会产生意识呢?另外一种可能是其智能达到可以开始改进自身智能的程度,智能开始指数提升,也将是另外一番景象。目前,人工神经网络的上限还是未知数。

~

OpenAI GPT模型的技术进展

GPT-1 的重要性是看到了预训练一个大的(自然语言处理)模型,其表现比传统的针对单个具体任务进行训练的专门模型效果还要好。

GPT-2 的关键是验证了预训练大模型具有迁移能力,可以把预训练中学到的东西,通过微调迁移到新的下游任务模型中。

GPT-3 的核心是验证了大模型具有很强的泛化能力,在少样本和零样本情况下,尤其是通过场景下学习(In-context-learning)和给定提示解决问题,无需微调。

GPT-3.5 的重要突破是「可用」,引入了指令微调。 ChatGPT 就是基于此在人类对话方面做指令微调,以及在安全性、可靠性方便的对齐。

GPT-4 开始跨模态,在语言(文本)的基础上加入了对图像的认知。


陆奇演讲:大模型带来的新范式

以下内容摘录自 陆奇的 演讲视频文字版, 以《新范式 新时代 新机会》为主题阐述了他对这轮AI技术变革的观点。

范式拐点

人类社会是复杂体系,复杂体系都有三个子系统,它包括:

  1. 信息子系统(subsystem of information),体系必须从环境中获得信息。
  2. 模型子系统(subsystem of model),用模型对信息进行表达。它必须充分有效地表达信息,这种表达方式让它可以做推理、做分析、做规划。(注:例如语言)
  3. 行动子系统(subsystem of action) ,根据推理和规划与环境互动,来达到这个复杂体系的目的。


(视频截图)

图中互联网开启的范式,是信息子系统的拐点,是信息的获取成本从边际移向固定成本,使得信息变得无处不在。世界因此而变得扁平。例如电子地图服务的投入和每年的成本都是巨大的,但是普通用户尽然可以免费使用。

这一次是由大语言模型开始的范式,是模型子系统的拐点,这里的模型就是知识,模型/知识的成本发生了类似的结构性变化,也将从边际成本发展为固定成本。例如 OpenAI 提供的 ChatGPT 服务,用户是可以免费使用的。

模型将无处不在,即知识将无处不在。
相比于信息时代,模型/知识的产能更强大,发展的速度一定会比过去更快。今天我们打开手机、打开任何一个设备,信息就过来了;以后打开任何一个设备,是模型/知识过来了。医生诊断、律师服务、设计师、艺术家等等,方方面面它都无处不在。

人的能力可抽象出三组模型:

  1. 认知模型,我们能听、能看、能说、能思考。
  2. 任务模型,我们每个人都能爬楼梯、剥番茄,做各种各样的动作来完成任务。
  3. 领域模型,有些人是律师,有些人是医生,有些人是科学家等等。

基于三位一体的结构,下一个拐点是行动子系统。将是机器人、自动驾驶和空间计算的组合为基础。
今天采取行动的成本很高,但借助大模型的互动,未来采取行动与环境互动以满足人的需求的成本将会越来越低,行动将无处不在。

特斯拉目前处在非常优势的地位,因为它在机器人技术、自动驾驶技术、人工智能技术方面的整体布局相当完整。

社会影响

农业社会:让人可以定居,从此有了“家”的存在
工业社会:解放土地对人的束缚,减少大量体力劳动
信息时代:随时随地获取信息,减少信息差和耗费的时间
AI大模型时代:脑力劳动有了替代,人类有了智能伙伴
AGI通用智能时代:建立全新价值体系,探索更多未来

YC 和 OpenAI 在做一项 UBI(Universal Basic Income, 通用基本收入) 研究,它研究的问题是:当人们不需要为了谋生而工作的时候,人们的驱动力和行为将会发生怎样的变化。


(视频截图)

开发者堆栈技术发展和开发者生态的雏形:


(视频截图)

原视频/文章还有更多行业应用梳理和产业机会等篇章。


AI展望周刊,个人向的阅读摘录,关注AI、理解AI,注视正在发生的未来。