神经日报 12月12日消息,据GoogLe官方博客,谷歌发布新一代人工智能模型Gemini 2.0。Gemini 2.0支持文本、图像、视频、音频等多模态输入,具备原生图像生成、多语言文本转语音(TTS)等多模态输出功能。相较Gemini 1.5 Pro,模型速度提升至两倍,并优化多模态推理、复杂指令执行和工具使用能力,支持调用Google搜索、代码执行和第三方功能。
实验版本Gemini 2.0 FlASH现已向开发者开放,2025年1月将全面推广多模态功能,并推出多模态实时API,为开发者提供更多应用支持。