2023.20 这轮AI模型带来的范式变化
2023年第20周 (05-15 ~ 05-21) 人工神经网络能否实现AGI(通用人工智能) 观看 AlphaGo 的纪录片,回顾 2016 年 AlphaGo 与 李世石的围棋对战,仍然让我感到激动。 IBM开发的 深蓝 战胜了国际象棋大师卡斯帕罗夫,使用的是穷举法。与国际象棋不同,围棋的棋盘规模更大,规则简单,可能的走法空间非常大,这导致穷举法无法在合理的时间内计算出最优解。 由 DeepMind 开发的 AlphaGo 战胜围棋世界冠军李世石,和战胜柯洁的 AlphaMaster 都是基于人工神经网络,这使得它们不仅能在局部战术上计算多步走棋,更能学习和判断全盘局势。 如今,GPT 3.5 等大型语言模型具备阅读、理解和推理能力。Midjourney 和 StableDiffusion 扩散模型具有绘画能力,OpenAI 的 Whisper 具有de 语音识别能力,Meta 的 Segment-anything 对图像语义分割的能力,单项智能已经等于甚至超过了一般人类,而这些都是基于深度学习的人工神经网络。 当单个跨模态(多模态)的大型神经网络模型逐步具备所有这些能力,“脑容量”继续扩大,其智能肯定会一步步向人类靠近。但是否会产生意识呢?另外一种可能是其智能达到可以开始改进自身智能的程度,智能开始指数提升,也将是另外一番景象。目前,人工神经网络的上限还是未知数。 ~ OpenAI GPT模型的技术进展 GPT-1 的重要性是看到了预训练一个大的(自然语言处理)模型,其表现比传统的针对单个具体任务进行训练的专门模型效果还要好。 GPT-2 的关键是验证了预训练大模型具有迁移能力,可以把预训练中学到的东西,通过微调迁移到新的下游任务模型中。 GPT-3 的核心是验证了大模型具有很强的泛化能力,在少样本和零样本情况下,尤其是通过场景下学习(In-context-learning)和给定提示解决问题,无需微调。 GPT-3.5 的重要突破是「可用」,引入了指令微调。 ChatGPT 就是基于此在人类对话方面做指令微调,以及在安全性、可靠性方便的对齐。 GPT-4 开始跨模态,在语言(文本)的基础上加入了对图像的认知。 陆奇演讲:大模型带来的新范式 以下内容摘录自 陆奇的 演讲视频 和 文字版, 以《新范式 新时代 新机会》为主题阐述了他对这轮AI技术变革的观点。 范式拐点 人类社会是复杂体系,复杂体系都有三个子系统,它包括: 信息子系统(subsystem of information),体系必须从环境中获得信息。 模型子系统(subsystem of model),用模型对信息进行表达。它必须充分有效地表达信息,这种表达方式让它可以做推理、做分析、做规划。(注:例如语言) 行动子系统(subsystem of action) ,根据推理和规划与环境互动,来达到这个复杂体系的目的。 (视频截图)...