Google推出了Gemini,这是该公司迄今为止最强大和多功能的AI模型。Google DeepMind的首席执行官兼联合创始人Demis Hassabis将Gemini介绍为一种多模态模型,能够无缝地理解和结合各种类型的信息,包括文本、代码、音频、图像和视频。
Gemini有三个优化版本:Ultra、Pro和Nano。Ultra模型具有最先进的性能,在语言理解方面超过了人类专家,并在从编码到多模态基准测试的任务中展示了前所未有的能力。
Gemini的独特之处在于其本地多模态性,无需为不同的模态拼接单独的组件。通过Google团队的大规模协作努力进行了精细调整的这种突破性方法,使Gemini成为一种灵活高效的模型,能够在数据中心和移动设备上运行。
Gemini的一个突出特点是其复杂的多模态推理能力,使其能够从大规模数据集中精确提取见解。该模型的能力还包括理解和生成流行编程语言中的高质量代码。
然而,随着Google进入这个新的AI时代,责任和安全仍然至关重要。Gemini经过严格的安全评估,包括对偏见和有害性的评估。Google正在积极与外部专家合作,解决潜在的盲点,并确保模型的道德部署。
Gemini 1.0现已在各种Google产品中推出,包括Bard聊天机器人,并计划将其整合到Search、Ads、Chrome和Duet AI中。然而,Bard升级版在欧洲尚未获得监管机构的批准,因此暂不发布。
开发人员和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。Android开发人员还可以通过Android 14中的新系统功能AICore使用Gemini Nano进行构建。
(图片来源:Google)
标签:ai、artificial intelligence、bard、deepmind、gemini、gemini nano、gemini pro、gemini ultra、google gemini、model、multimodal