谷歌以人工智能的进步迎来了“双子座时代”。

谷歌推出了一系列AI产品的更新,包括引入Gemini 1.5 Flash、Gemini 1.5 Pro的改进以及Project Astra的进展,后者是谷歌对未来AI助手的愿景。

Gemini 1.5 Flash是谷歌模型系列的新成员,旨在提供更快速、更高效的规模服务。虽然比1.5 Pro更轻量级,但它仍然具备跨大量信息进行多模态推理的能力,并具备一百万个标记的突破性长上下文窗口。

谷歌DeepMind的首席执行官Demis Hassabis解释说:“1.5 Flash在摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等方面表现出色。这是因为它通过一种称为‘蒸馏’的过程,从更大的模型中转移了最基本的知识和技能到一个更小、更高效的模型。”

与此同时,谷歌显著提升了Gemini 1.5 Pro模型的能力,将其上下文窗口扩展到了创新性的两百万个标记。对其代码生成、逻辑推理、多轮对话以及音频和图像理解能力进行了改进。

谷歌还将Gemini 1.5 Pro整合到了谷歌产品中,包括Gemini Advanced和Workspace应用。此外,Gemini Nano现在可以理解多模态输入,不仅限于纯文本,还包括图像。

谷歌还宣布了其下一代开放模型Gemma 2,旨在实现突破性的性能和效率。Gemma系列还通过PaliGemma进行了扩展,这是该公司首个受PaLI-3启发的视觉语言模型。

最后,谷歌分享了Project Astra(先进的视听响应代理)的进展,这是谷歌对未来AI助手的愿景。该公司已经开发出了能够更快地处理信息、更好地理解上下文并在对话中快速响应的原型代理。

谷歌首席执行官Sundar Pichai解释说:“我们一直希望构建一个在日常生活中有用的通用代理。Project Astra展示了多模态理解和实时对话能力。”

“有了这样的技术,很容易想象未来人们可以通过手机或眼镜拥有一个专家级的AI助手。”

谷歌表示,其中一些功能将在今年晚些时候应用于其产品。开发人员可以在这里找到与Gemini相关的所有公告。

想要了解更多关于AI和大数据的信息,可以参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个综合性的活动与其他领先的活动同时举办,包括Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo。

探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会。