发布时间:2024-06-19 14:00:02 栏目:综合精选
上周二,谷歌宣布了一款新的人工智能产品 Gemini Live。与OpenAI 最近宣布的 GPT-4o类似,Gemini Live 是一个原生的多模态 AI 模型,具有令人印象深刻的语音和视频功能。
Gemini Live 只是“Project Astra”的一部分,Project Astra 是一个通用人工智能代理,可能会应用于智能眼镜。目前,Gemini Live 将是该代理在智能手机上的首次迭代。
我们能够在Google I/O 2024的演示中看到语音和视频对话的测试。
然而,Gemini Live 目前尚未推出。那么 Gemini Live 有哪些功能可用,我们什么时候可以在 Android 设备上看到它呢?请继续阅读以了解详情。
Google 刚刚向付费的Gemini Advanced用户推出了Gemini 1.5。它带来了扩展的上下文窗口,例如,它允许 Gemini 解析多个大型文档或汇总多达 100 封电子邮件。
1.5 增加了对图像理解和构建可视化和图表的改进。与 GPT-4o 不同,Gemini 确实依赖于Imagen 3和Google Veo等其他模型来输出图像和视频。
1.5 更新版本可以将 Google Docs、PDF 和其他文档上传到 Gemini 以获取摘要、反馈和答案。
免责声明:本文由用户上传,如有侵权请联系删除!