2023.07 AI展望周刊

2023年第7周 (02-13 ~ 02-19)

“从长远来看，人类进步和经济增长的唯一真正驱动力是能够促进科学进步的社会结构，然后是科学进步本身。” —— Sam Altman

下一个时代的人工智能

OpenAI 的CEO Sam Altman 在2022年9月(是在12月发布ChatGPT之前）的一次论坛中谈论人工智能的新前沿，有很多前瞻性的观点或洞察，非常值得一读。

原文：文字版，视频版

Sam Altman 认为：

这些强大的模型将成为新的技术平台，将诞生大量新公司基于模型接口提供商业服务。
初创企业不必创建基础大模型，只需在细分场景中优化微调出一个特定版本的模型，关键是拥有唯一的数据，并产生飞轮效应。称之为中间层，将创造很多价值。
当前人们最大的认知错误是“认为AI是基于已有数据训练出来的，不能产生新知识。能够降低智能的成本，但不会增加人类的知识总和”
在科学方面，正在发生两件事，一是科学专用产品，例如 AlphaFold （注：可以找到新的蛋白质结构），正在产生巨大的价值，这种方式也会越来越多。二是基于AI的工具可以让我们所有人都更有效率，帮助我们思考新的研究方向，或编写代码，这对工程师或科学家的净产出的影响，是对科学作出贡献的另外一种方式。
以上两件事是很大的进步、且会加速。这将是技术发展、科学发展发生方式的重大变化。
“我坚信，从长远来看，人类进步和经济增长的唯一真正驱动力是能够促进科学进步的社会结构，然后是科学进步本身。”
然后是一件更大的事——很好，但也更让人害怕的事——开始探索让AI成为AI科学家和自我改进。我们是否能让人工智能作为一名开发者，把我们（OpenAI）在做的事自动化？帮助我们解决我们还不知道如何解决的真正困难——AI模型对齐问题？
什么是对齐问题(alignment problem)？
我们要制造这个非常强大的系统，如果它不按我们的意愿行事，或者它的目标与我们的目标相冲突，那将是非常糟糕的，这些科幻作品中有很多描述，或者它并不那么关心我们的目标。
所以我们如何构建 AGI 来做最符合人类利益的事情？我们如何确保人类能够决定人类的未来？我们如何避免意外误用，即出现我们没有预料到的错误情况？还有故意误用，即坏人使用AGI造成巨大危害，即使这正是另一个人想要的。以及内部对齐问题，如果这个系统变成了一个把我们视为威胁的生物怎么办？
关于人工智能接下来的走向：语言模型会比人们想象的走得更远，很多人所说的计算耗尽、数据耗尽的说法是对的。但算法上还会有很多进步，我们将度过一段非常激动人心的时光。1，将会有真正的多模态模型，不仅是文本和图像。2，将拥有不断学习的模型。现在的模型，例如GPT，只停留在训练后的状态，使用它的次数越多，它并没有变得更好。
AI 将无处不在。未来十年的一个基本趋势是——智能的边际成本和能源的边际成本都将迅速趋向于零。这是两个最基础的成本，当社会的整个成本结构发生变化时，我们知道各方面都会发生巨大变化，但无法预测具体怎么变化。
观众提问类似GPT-3这样的技术将对生命科学的研究产生什么影响？ S.A. 答道：目前可用的模型并不足以对该领域产生重大影响，只是在某些情况下有点帮助。不过，我认为这种情况将会改变，这是一个少有的有机会创立新的千亿美元到万亿美元公司的领域之一。
生物学的限制仍将存在，人体试验需要花费很长时间。因此，一个有趣的点在于：你可以在哪些方面避免这种情况？我所见过的最有趣的合成生物公司，都找到了一种让循环时间变得超级快的方法。这有利于AI为你提供很多好的想法，但你仍然需要测试它们，这就是现在的情况。

“我认为AI不会改变所有深层的生物学因素。我认为我们仍然会非常关注与他人的互动，100年后人们所关心的事情更有可能是人类5万年前关心的事情，而不是100年前。”

提示词工程(prompt engineering)是一个过渡，之后自然语言就是通用的交互接口，直接用语言告诉计算机你想让它做的任何事。所以永远重要的是想法的质量和对你想要的东西的理解。艺术家仍然会在图像生成方面做得最好，但不是因为他们想出了某个魔法提示词，而是因为他们能够用我没有的创造性来表达它。
随着 AI 的持续发展，显然对社会和经济的影响将是巨大的。我们必须弄清楚的事情是——我们如何考虑公平分配财富、访问 AGI 系统的途径（这个时代的商品）。以及治理方式，如何集体决定它们可以做什么，不能做什么等等。我认为找出这些问题的答案将非常重要。
大模型是基础设施，大量创业机会在“中间层”。是在已有的大模型基础上，为每个垂直领域训练自己的模型。

Toolformer: 一款可以自主学习使用工具的语言模型

模型的论文

以下是翻译和摘录@anita在tweets 写的介绍：

要克服当今语言模型的局限性，简单的方法就是赋予它们使用外部工具（通过API调用）的能力，如搜索引擎、计算器或日历。更好的是，模型可以自主学习如何使用这些工具。

那么它是如何实现的呢？训练过程非常简单：

使用几个API调用示例，生成未来的潜在API请求数据集。
过滤出效果良好的样本。
在这些“有用”的样本上对LLM进行微调。

最终，模型可以决定：

调用哪些API，
何时调用它们，
传递哪些参数，以及
如何最好地将结果融入未来的标记预测中。

通过使用计算器作为例子，Toolformer 在数学和算术问题上表现优于 GPT-3，但也存在一些限制，例如不能在不同工具之间链接 API 调用、只能使用非交互式工具，需要大量示例才能生成良好的 API 请求等。

训练AI做投资人的助理

英文原文：This VC Is Slowly Automating His Job
@阿法兔的中文翻译&分析：这家VC开始用AI代替投资人了？

中岛洋平（Yohei Nakajima ）是风险投资公司Untapped Capital的GP（普通合伙人）。这篇文章介绍了他通过哪些工具来构建自己的AI机器人，来应对工作和生活中耗费精力和时间的6种场景。我们可以参考这篇文章来构建我们自己的AI机器人，做我们的个人助理、团队助理、项目助理。

Yohei 的AI机器人1号「Mini Yohei」，可以自动化的（通过邮件）回答创始人的问题。

作为面对创始人的时候，我一直在回答这些问题，比如说，创始人会问我问题，有时我有答案，可以回答。但是，有时我必须在谷歌上搜索，自己做研究，才能得到答案，因为我不是全能的。
所以我想"也许我可以试图把这项工作自动化？"，这就是我建立Mini Yohei的原因。

Yohei 的AI机器人2号，可以自动总结和某个人交流的所有邮件，这样每次开会之前，Yohei 可以快速回顾交流过的内容，保持随时了解创始人和LP最新的情况。

在与某人会面之前，我会不断查看旧笔记和过去的电子邮件，以记住我们谈论的内容。这样做很痛苦，所以我构建了一个工具来解决它。

Yohei的机器人3号，对 TechMeme 的文章做摘要，并汇总之后通过电子邮件发送。

现在我只看那封电子邮件而不是 TechMeme。这是一个微小的效率改善，但如果你要读大量信息，这会有累积效应。

Yohei 的AI机器人4号，可以在给定某个初创公司的网站后，自动帮他起草一份投资备忘录。其中包括公司的价值主张、产品描述、可能的竞争对手，甚至是产品发布会上的情绪热度等数据。

我还将它用作与创始人沟通的工具，这是我在构建它之前没有想到的。如果我正在看一家新公司，可以生成一个备忘录并与创始人分享，这是与创始人开启对话的好方式，并立即为他们提供了价值。

Yohei 的机器人5号，基于个人数据库的问答机器人。

例如，我有一个数据库，我在其中收集了有关初创公司的有用信息的文章。我可以问它一个问题，比如“哪些文章是关于增长的？” 根据问题，AI会猜测应该看哪张表，并在表中找到最相关的行。然后，它将这些行反馈到GPT-3，GPT-3将输出一个答案。

Yohei 的AI机器人6号，对来自孩子学校的邮件做摘要

我为啥做这个应用？因为我真的很苦恼于这样的问题：“小朋友的下一个X活动是什么时候？“或者 “我什么时候要给小朋友报名参加Y活动？”
通常我必须搜索我的电子邮件并阅读一堆内容才能找到答案。但有了这个，我只需搜索关键字，它就会向我展示我需要知道的要点。这对忙碌的父母来说真的很有用。

@阿法兔研究笔记：“对于风险投资人来说，时间就是金钱，如果你能提高时间的使用效率，工作就会立刻变得更好，这就是工具带来的能力。”

AI展望周刊

一份关于人工智能的资讯摘录周刊，记录值得关注的AI项目、研究进展、行业动态、引人思考的观点和鼓舞人心的理念。注视正在发生的未来。

推广：

阿里云百炼大模型 9折优惠 + 所有模型各百万免费Token →

即梦免费AI画图、生成视频。每日领免费额度，可累加 →

下一个时代的人工智能#

Toolformer: 一款可以自主学习使用工具的语言模型#

训练AI做投资人的助理#

下一个时代的人工智能

Toolformer: 一款可以自主学习使用工具的语言模型

训练AI做投资人的助理