Google 云端硬盘中的 Gemini:会说话的文档
我们的 Google 云端硬盘里都存着很多长篇文档,包括 80 页的行业分析报告、内容详尽的会议记录,或是等待我们处理的复杂合同。用 ChatGPT 或 Gemini 之类的软件快速浏览一下似乎是个好主意,但如果能以播客的形式收听呢?
这正是谷歌最新人工智能实验项目 Gemini 的功能所在。这项名为“音频概览”的新功能现已在 Google 云端硬盘中推出,它可以将篇幅较长的 PDF 文档转换为时长两到十分钟的短音频片段。
这项技术基于谷歌的 NotebookLM 研究工具。当您在网页浏览器中打开 PDF 文件时,顶部栏会出现一个“音频概述”按钮。点击该按钮会打开 Gemini 侧边栏,几分钟后会生成一段音频摘要。
录音会自动保存到您云端硬盘中新建的“音频概览”文件夹。准备就绪后,您会收到电子邮件通知,并可在智能手机或电脑上收听。谷歌强调,此功能旨在方便用户同时处理多项任务,让您在处理日常事务的同时“吸收关键信息”。
然而,并非所有用户都能使用此功能。目前,此功能仅适用于付费的 Google Workspace Business Standard/Plus、Enterprise Standard/Plus 和 Google One AI Pro 用户。发布初期,该功能仅支持英文 PDF 文档。

























