2023.09 AI展望周刊
2023年第9周 (02-27 ~ 03-05) 人人都能使用AI很重要,否则加剧不平等。 (Generated with StableDiffusion 1.5) 实践:用AI总结视频内容 以小Lin说的这期视频为例,是个很好的科普视频,回顾了ChatGPT和聊天机器人的历史,以及OpenAI、微软和谷歌在其中的角色和故事。 (视频截图) 以下是 ChatGPT 对视频内容的概括: “视频介绍了Chat GPT,一个强大的聊天机器人,它具有强大的自然语言生成能力,可以编写脚本和小说,甚至参加医学和司法考试。该视频还探讨了聊天机器人的起源,机器学习的基本理念,神经网络的发展,以及OpenAI和微软的合作。视频还提到了大型语言模型的优缺点,需要对其使用谨慎并审慎考虑其输出。 Chat GPT 的突破在于它可以提高人类和机器之间的沟通效率,但也引发了一些问题,如可能导致谁失业等。” 具体方法和过程是: 首先用开源的AI模型Whisper(来自于OpenAI)+ 开源工具 autocut,将音频听录成字幕。 再人工将内容文本按篇章进行分段,让ChatGPT分别进行总结。 最后将所有分段总结合并在一起,再让ChatGPT做一次总结。 Whisper 和 ChatGPT 都是支持多语言的,所以也可以直接实现跨语言的内容总结。 OpenAI 上线 ChatGPT 和 Whisper API 服务 3月1日,OpenAI 推出 ChatGPT 和 Whisper API,使开发者能够将先进的文本对话和语音转文本能力,集成到他们的程序和产品中。 公布的 gpt-3.5-turbo 模型是和当前 ChatGPT 使用的相同模型。相较之前的 text-davinci-003 模型,成本下降了 10 倍! 调用 API 的计费价格也随之降低。 Whisper 是 OpenAI 开源的语音转文本模型,支持多语言(包括中文),效果很好。 这将进一步促进更多应用场景的出现。官方博文 中也演示了一些企业已使用新版API将 ChatGPT的能力融入到了自身的产品中,例如 Snapchat、Quizlet、Instacart等。 OpenAI 还根据开发者反馈调整了其 API 的服务条款,例如不再将通过API提交的数据用于训练 ChatGPT。 商业服务上,可提供专用实例(服务器),以便用户更好地控制特定模型版本和系统性能。 内容参考自官方博文。 以及 Chat completions 的API 文档。...