Gemini Live目前有哪些功能以及即将推出哪些功能

发布时间：2024-06-19 14:00:02 栏目：综合精选

导读上周二，谷歌宣布了一款新的人工智能产品 Gemini Live。与OpenAI 最近宣布的 GPT-4o类似，Gemini Live 是一个原生的多模态 AI 模型

上周二，谷歌宣布了一款新的人工智能产品 Gemini Live。与OpenAI 最近宣布的 GPT-4o类似，Gemini Live 是一个原生的多模态 AI 模型，具有令人印象深刻的语音和视频功能。

Gemini Live 只是“Project Astra”的一部分，Project Astra 是一个通用人工智能代理，可能会应用于智能眼镜。目前，Gemini Live 将是该代理在智能手机上的首次迭代。

我们能够在Google I/O 2024的演示中看到语音和视频对话的测试。

然而，Gemini Live 目前尚未推出。那么 Gemini Live 有哪些功能可用，我们什么时候可以在 Android 设备上看到它呢?请继续阅读以了解详情。

Google 刚刚向付费的Gemini Advanced用户推出了Gemini 1.5。它带来了扩展的上下文窗口，例如，它允许 Gemini 解析多个大型文档或汇总多达 100 封电子邮件。

1.5 增加了对图像理解和构建可视化和图表的改进。与 GPT-4o 不同，Gemini 确实依赖于Imagen 3和Google Veo等其他模型来输出图像和视频。

1.5 更新版本可以将 Google Docs、PDF 和其他文档上传到 Gemini 以获取摘要、反馈和答案。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

猜你喜欢

最新文章

头条推荐

热点文章

点击排行