2023.07 AI展望周刊
2023年第7周 (02-13 ~ 02-19) “从长远来看,人类进步和经济增长的唯一真正驱动力是能够促进科学进步的社会结构,然后是科学进步本身。” —— Sam Altman 下一个时代的人工智能 OpenAI 的CEO Sam Altman 在2022年9月(是在12月发布ChatGPT之前)的一次论坛中谈论人工智能的新前沿,有很多前瞻性的观点或洞察,非常值得一读。 原文: 文字版,视频版 Sam Altman 认为: 这些强大的模型将成为新的技术平台,将诞生大量新公司基于模型接口提供商业服务。 初创企业不必创建基础大模型,只需在细分场景中优化微调出一个特定版本的模型,关键是拥有唯一的数据,并产生飞轮效应。称之为中间层,将创造很多价值。 当前人们最大的认知错误是“认为AI是基于已有数据训练出来的,不能产生新知识。能够降低智能的成本,但不会增加人类的知识总和” 在科学方面,正在发生两件事,一是科学专用产品,例如 AlphaFold (注:可以找到新的蛋白质结构),正在产生巨大的价值,这种方式也会越来越多。二是基于AI的工具可以让我们所有人都更有效率,帮助我们思考新的研究方向,或编写代码,这对工程师或科学家的净产出的影响,是对科学作出贡献的另外一种方式。 以上两件事是很大的进步、且会加速。这将是技术发展、科学发展发生方式的重大变化。 “我坚信,从长远来看,人类进步和经济增长的唯一真正驱动力是能够促进科学进步的社会结构,然后是科学进步本身。” 然后是一件更大的事——很好,但也更让人害怕的事——开始探索让AI成为AI科学家和自我改进。我们是否能让人工智能作为一名开发者,把我们(OpenAI)在做的事自动化?帮助我们解决我们还不知道如何解决的真正困难——AI模型对齐问题? 什么是对齐问题(alignment problem)? 我们要制造这个非常强大的系统,如果它不按我们的意愿行事,或者它的目标与我们的目标相冲突,那将是非常糟糕的,这些科幻作品中有很多描述,或者它并不那么关心我们的目标。 所以我们如何构建 AGI 来做最符合人类利益的事情?我们如何确保人类能够决定人类的未来?我们如何避免意外误用,即出现我们没有预料到的错误情况?还有故意误用,即坏人使用AGI造成巨大危害,即使这正是另一个人想要的。以及内部对齐问题,如果这个系统变成了一个把我们视为威胁的生物怎么办? 关于人工智能接下来的走向:语言模型会比人们想象的走得更远,很多人所说的计算耗尽、数据耗尽的说法是对的。但算法上还会有很多进步,我们将度过一段非常激动人心的时光。1,将会有真正的多模态模型,不仅是文本和图像。2,将拥有不断学习的模型。现在的模型,例如GPT,只停留在训练后的状态,使用它的次数越多,它并没有变得更好。 AI 将无处不在。未来十年的一个基本趋势是——智能的边际成本和能源的边际成本都将迅速趋向于零。这是两个最基础的成本,当社会的整个成本结构发生变化时,我们知道各方面都会发生巨大变化,但无法预测具体怎么变化。 观众提问类似GPT-3这样的技术将对生命科学的研究产生什么影响? S.A. 答道:目前可用的模型并不足以对该领域产生重大影响,只是在某些情况下有点帮助。不过,我认为这种情况将会改变,这是一个少有的有机会创立新的千亿美元到万亿美元公司的领域之一。 生物学的限制仍将存在,人体试验需要花费很长时间。因此,一个有趣的点在于:你可以在哪些方面避免这种情况?我所见过的最有趣的合成生物公司,都找到了一种让循环时间变得超级快的方法。这有利于AI为你提供很多好的想法,但你仍然需要测试它们,这就是现在的情况。 “我认为AI不会改变所有深层的生物学因素。我认为我们仍然会非常关注与他人的互动,100年后人们所关心的事情更有可能是人类5万年前关心的事情,而不是100年前。” 提示词工程(prompt engineering)是一个过渡,之后自然语言就是通用的交互接口,直接用语言告诉计算机你想让它做的任何事。所以永远重要的是想法的质量和对你想要的东西的理解。艺术家仍然会在图像生成方面做得最好,但不是因为他们想出了某个魔法提示词,而是因为他们能够用我没有的创造性来表达它。 随着 AI 的持续发展,显然对社会和经济的影响将是巨大的。我们必须弄清楚的事情是——我们如何考虑公平分配财富、访问 AGI 系统的途径(这个时代的商品)。以及治理方式,如何集体决定它们可以做什么,不能做什么等等。我认为找出这些问题的答案将非常重要。 大模型是基础设施,大量创业机会在“中间层”。是在已有的大模型基础上,为每个垂直领域训练自己的模型。 相关资讯 晚点LatePost的这篇文章:《火鸡追上雄鹰,OpenAI 的成功为何难以复制》,描述了OpenAI 的诞生和发展的过程。 硅谷101这期播客:《生命科学走出一百年黑暗探索|AIGC特辑》,嘉宾来自生物医药行业,从业内角度聊了现阶段AI技术和生物医药已有的结合方式和成果。 Toolformer: 一款可以自主学习使用工具的语言模型 模型的论文 以下是翻译和摘录@anita在tweets 写的介绍: 要克服当今语言模型的局限性,简单的方法就是赋予它们使用外部工具(通过API调用)的能力,如搜索引擎、计算器或日历。更好的是,模型可以自主学习如何使用这些工具。 那么它是如何实现的呢?训练过程非常简单: 使用几个API调用示例,生成未来的潜在API请求数据集。 过滤出效果良好的样本。 在这些“有用”的样本上对LLM进行微调。 最终,模型可以决定: 调用哪些API, 何时调用它们, 传递哪些参数,以及 如何最好地将结果融入未来的标记预测中。 通过使用计算器作为例子,Toolformer 在数学和算术问题上表现优于 GPT-3,但也存在一些限制,例如不能在不同工具之间链接 API 调用、只能使用非交互式工具,需要大量示例才能生成良好的 API 请求等。 ...