谷歌发布全新AI创作工具 加速多模态内容生成

谷歌在近期举行的I/O开发者大会上宣布了一系列面向开发者的AI创作工具升级,旨在通过最新的Gemini模型家族,降低多媒体内容的生成门槛并提升效率。 此次更新的核心之一是推出了Gemini 3.5 Flash模型。该模型已作为默认模型集成到Gemini应用和Google搜索的AI模式中。它专注于编码、智能体任务和真实工作流,相较于前代模型,其输出速度提升显著...

谷歌在近期举行的I/O开发者大会上宣布了一系列面向开发者的AI创作工具升级,旨在通过最新的Gemini模型家族,降低多媒体内容的生成门槛并提升效率。 此次更新的核心之一是推出了Gemini 3.5 Flash模型。该模型已作为默认模型集成到Gemini应用和Google搜索的AI模式中。它专注于编码、智能体任务和真实工作流,相较于前代模型,其输出速度提升显著,据称是其他前沿模型的4倍。开发者可以利用它快速生成网页界面、互动组件,甚至将复杂论文转化为可视化学习卡片,为规模化AI应用的开发提供了更平衡的模型选择。 在视频和多模态创作领域,谷歌发布了全新的Gemini Omni模型。该模型能够理解并处理文本、图像、音频和视频输入,并生成连贯的视频内容。其最突出的特点是支持对话式编辑,用户只需用自然语言描述修改需求,如更换角色、调整光线或改变场景,模型便能自动完成编辑。为应对安全与溯源挑战,所有由Omni生成的视频都将嵌入不可见的SynthID数字水印,以便识别AI生成内容。目前,Gemini Omni Flash版本已面向订阅用户开放,并将在未来通过API提供给开发者。 此外,谷歌也在将AI能力进一步融入开发与设计流程。例如,Google Labs推出的免费设计工具Stitch,允许开发者通过自然语言对话生成用户界面原型,并可一键导出至Figma或HTML/CSS代码,将设计构思转化为可用资产的流程大幅缩短。

查看原文