2023.08 AI展望周刊

2023年第8周 (02-20 ~ 02-26)

闲言：你可以选择成为一名“AI训练师”，微调预训练的大模型，用独有数据铸造自己的独特价值。

不要让版权巨头垄断AIGC

原文: Don’t Let Disney Monopolize A.I.-Generated Art , by Jon Stokes

AIGC作品的版权问题引起了广泛的讨论和争论，然而在法律上仍处于模糊地带。这篇文章观察和探讨了大公司所处的位置以及潜在的公平性问题。

在独立艺术家起诉 Stable Diffusion 所属公司 Stability AI 的时候，迪士尼和好莱坞其他公司对此一直保持着沉默，虽然这些AI工具也可以根据文本提示生成出具有标志性版权角色的图片。大公司们并非不在乎，而是在观察，因为对他们来说，事关生死存亡。

起诉 Stable Diffusion 的独立艺术家可能没有意识到这一点，但他们正在做老鼠的肮脏工作。

文章中推演了具体场景，随着AIGC技术和工具的逐步完善，未来可以代替整个工作室和知识产权公司，从而威胁到诸如迪士尼、皮克斯和漫威等公司的存在。独立艺术家和个人可以更容易地创作、传播和获取数字作品。

(图片由人工提示 + 开源模型Stable Diffusion生成)

如果AIGC被控非法使用版权素材成立，类似Stable Diffusion这类开源的、可自由使用的工具和数字作品将被大型公司要求关闭其公开访问。封闭的模型、集中的、可审查的内容将以可控的、付费的方式填补内容需求。这将导致独立创作者和非商业用户无法使用这些工具和内容，而迪士尼等大公司可以与微软、谷歌等合作使用专有的AI工具制作大量新的内容，并受版权保护。

由此技术进步带来的巨大收益将再被少数人垄断。我们需要更加深入地思考如何在保护知识产权的同时，促进AIGC技术的公平使用和创新？

为什么生成式AI激怒了艺术家而不是作家

ChatGPT 比 AI 艺术更受欢迎，为什么作家没有反应？

原文： Why Generative AI Angers Artists but Not Writers, by Alberto Romero

文章指出，生成AI会对所有类型的办公室工作产生影响。艺术家、作家、程序员和任何被称为“白领”的人都处于危险之中。虽然生成AI可能存在缺陷，但它有潜力颠覆知识和创意工作，不久之后，使用最先进的AI系统的个人，其能力和价值将等于现在的一个团队。

(图片由人工提示 + 开源模型Stable Diffusion生成)

艺术家是最受威胁的，因为他们的作品是以风格为主导的，而生成AI可以很容易地混合和重新组合数据以制作类似的作品。相比之下，作家不太受威胁，因为他们的作品中的风格并不像视觉艺术那么重要。虽然有些作家可能会尝试利用生成式AI，但其他作家则对其视而不见。

人们在理解图像和语言时有不同感知方式。由于语言的精确性更高，人们更容易识别语言中的对错和好坏，因此文学作品比视觉艺术更难被AI替代。语言可以准确地传达意义，而图像则更容易被人们解释和理解。

微软推出基于AI驱动的新Bing搜索引擎和浏览器

得益于投资 OpenAI，微软使用 ChatGPT 背后的技术来重新设计搜索引擎和浏览器，以提供更好的搜索结果、更完整的答案、新的聊天体验和生成内容的能力。微软认为，AI将从根本上改变每个软件类别，从最大的类别开始——搜索引擎。旨在通过重新设计这些日常使用的工具，让人们更好地利用网络的知识。

发布会完整视频：Introducing your copilot for the web: AI-powered Bing and Microsoft Edge

官方博文介绍： Reinventing search with a new AI-powered Microsoft Bing and Edge, your copilot for the web

视频中包含多个演示案例，例如

想去旅行，直接输入目的地和天数，要求AI创建一份旅游行程等。
浏览器中打开一份财报PDF，然后通过聊天方式，要求AI"总结要点"，接着，输入"以表格形式和xxx财报做比较"，然后 AI 抓取数据，输出一个表格，包括收入、增长、库存等等。

(视频截图)

博文中提到微软开发了一种使用 OpenAI 模型的专有方法，并称之为普罗米修斯模型。该模型专门针对搜索进行了定制，吸取了 ChatGPT 和 GPT-3.5 的重要经验并改进，比ChatGPT 更强大，速度更快、更准确。

相关阅读：

CNBC: Microsoft will let companies create their own custom versions of ChatGPT
微软计划发布的技术，可帮助大公司使用OpenAI ChatGPT技术启动自己的聊天机器人。公司可以在发布使用该软件开发的聊天机器人时删除微软或OpenAI品牌。

大语言模型将使语音成为 GUI 的第四个组件，以及使用行为的变化

原文：LLMs will result in Voice becoming a 4th component of the GUI , by Ben Buchanan

作者认为，现有的数字助理（如Siri）缺乏理解用户意图的能力，这一问题已被ChatGPT等大型语言模型解决。数字助理需要理解至少90%的查询意图才能提供足够良好的用户体验，而ChatGPT已经达到了这一水平。语音技术将成为与鼠标和键盘相同重要的数字交互方式。
微软已经宣布将LLM技术整合到其Office套件和Teams中，并发布一个新平台，使任何公司都可以构建在ChatGPT的基础技术上。

(图片由人工提示 + 开源算法生成)

语音助手（如Siri、Hey Google、Alexa、Cortana等）将获得升级，类似于从黑莓键盘转向触摸屏的转变。类似于Embra这样的产品正在基于AI GPT 为Mac构建智能应用，这些应用程序将迫使苹果公司更早地发布自己的数字助手（或升级Siri），以保持竞争力。

使用键盘和鼠标需要桌子支撑和特定的身体姿势。语音将使我们享有更多的空间位置和姿势上的自由。并且随着技术的提高，这将占据我们一天中越来越多的时间。相关的，预计显示器尺寸将增加，因为我们需要更大的显示器才能从远处看到屏幕上的内容。

(图片由人工提示 + 开源算法生成)

深度学习系统能够学会操作符号吗？人类智能的精确性从何而来？

原文： What AI Can Tell Us About Intelligence
By Jacob Browning and Yann LeCun, 2022-06

如果人工智能领域有一个不变的东西，那就是夸大：总是有令人窒息的炒作和轻蔑的否定。

文章讨论了人工智能在符号操作和深度学习领域的发展。深度学习通过识别和利用数据模式来学习，是当代AI的主要技术。现在，人们认为符号推理是一个重要的问题，因为它在语言和数学等方面都起着至关重要的作用，而深度学习无法很好地处理这种符号操作。
虽然一些人认为符号操作必须从一开始就硬编码，但深度学习的研究人员则相信符号操作已经可以通过学习获得。这种争论并不仅仅关乎未来的AI发展，也是关于如何理解人类智能以及如何实现人类水平的AI。

(图片由人工提示 + 开源模型Stable Diffusion生成)

认知科学中两个不同的观点：先天主义和经验主义。先天主义者认为人类大脑中的符号和符号操作是内在的，而经验主义者则认为符号和符号操作是人类通过文化进化逐渐获得的学习能力。
作者指出，这两个观点对于深度学习领域的发展和人工智能的实现都有重要影响。如果先天主义者是对的，那么单纯的深度学习永远不会达到人类智能，因为真正的符号操作需要天生的符号操作器。如果经验主义者是对的，那么向深度学习中添加符号操作模块是不必要的，而深度学习系统已经在进行符号推理，并将继续通过更多模态的自我监督学习来改进。

AI展望周刊

一份关于人工智能的资讯摘录周刊，记录值得关注的AI项目、研究进展、行业动态、引人思考的观点和鼓舞人心的理念。注视正在发生的未来。

推广：

阿里云百炼大模型 9折优惠 + 所有模型各百万免费Token →

即梦免费AI画图、生成视频。每日领免费额度，可累加 →

不要让版权巨头垄断AIGC#

为什么生成式AI激怒了艺术家而不是作家#

微软推出基于AI驱动的新Bing搜索引擎和浏览器#

大语言模型将使语音成为 GUI 的第四个组件，以及使用行为的变化#

深度学习系统能够学会操作符号吗？人类智能的精确性从何而来？#

不要让版权巨头垄断AIGC

为什么生成式AI激怒了艺术家而不是作家

微软推出基于AI驱动的新Bing搜索引擎和浏览器

大语言模型将使语音成为 GUI 的第四个组件，以及使用行为的变化

深度学习系统能够学会操作符号吗？人类智能的精确性从何而来？