谷歌以人工智能的进步迎来了“双子座时代”。

谷歌推出了一系列AI产品的更新，包括引入Gemini 1.5 Flash、Gemini 1.5 Pro的改进以及Project Astra的进展，后者是谷歌对未来AI助手的愿景。

Gemini 1.5 Flash是谷歌模型系列的新成员，旨在提供更快速、更高效的规模服务。虽然比1.5 Pro更轻量级，但它仍然具备跨大量信息进行多模态推理的能力，并具备一百万个标记的突破性长上下文窗口。

谷歌DeepMind的首席执行官Demis Hassabis解释说：“1.5 Flash在摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等方面表现出色。这是因为它通过一种称为‘蒸馏’的过程，从更大的模型中转移了最基本的知识和技能到一个更小、更高效的模型。”

与此同时，谷歌显著提升了Gemini 1.5 Pro模型的能力，将其上下文窗口扩展到了创新性的两百万个标记。对其代码生成、逻辑推理、多轮对话以及音频和图像理解能力进行了改进。

谷歌还将Gemini 1.5 Pro整合到了谷歌产品中，包括Gemini Advanced和Workspace应用。此外，Gemini Nano现在可以理解多模态输入，不仅限于纯文本，还包括图像。

谷歌还宣布了其下一代开放模型Gemma 2，旨在实现突破性的性能和效率。Gemma系列还通过PaliGemma进行了扩展，这是该公司首个受PaLI-3启发的视觉语言模型。

最后，谷歌分享了Project Astra（先进的视听响应代理）的进展，这是谷歌对未来AI助手的愿景。该公司已经开发出了能够更快地处理信息、更好地理解上下文并在对话中快速响应的原型代理。

谷歌首席执行官Sundar Pichai解释说：“我们一直希望构建一个在日常生活中有用的通用代理。Project Astra展示了多模态理解和实时对话能力。”

“有了这样的技术，很容易想象未来人们可以通过手机或眼镜拥有一个专家级的AI助手。”

谷歌表示，其中一些功能将在今年晚些时候应用于其产品。开发人员可以在这里找到与Gemini相关的所有公告。

想要了解更多关于AI和大数据的信息，可以参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个综合性的活动与其他领先的活动同时举办，包括Intelligent Automation Conference、BlockX、Digital Transformation Week和Cyber Security & Cloud Expo。

探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会。

相关文章

研究显示，AI聊天机器人可以识别种族，但种族偏见降低了回应的同理心。

研究：人工智能可能导致家庭监控结果不一致

问答：生成性人工智能的气候影响

Salesforce：在GenAI时代改变工作