谷歌的下一代人工智能模型Gemini表现优于GPT-4。

Google推出了Gemini，这是该公司迄今为止最强大和多功能的AI模型。Google DeepMind的首席执行官兼联合创始人Demis Hassabis将Gemini介绍为一种多模态模型，能够无缝地理解和结合各种类型的信息，包括文本、代码、音频、图像和视频。

Gemini有三个优化版本：Ultra、Pro和Nano。Ultra模型具有最先进的性能，在语言理解方面超过了人类专家，并在从编码到多模态基准测试的任务中展示了前所未有的能力。

Gemini的独特之处在于其本地多模态性，无需为不同的模态拼接单独的组件。通过Google团队的大规模协作努力进行了精细调整的这种突破性方法，使Gemini成为一种灵活高效的模型，能够在数据中心和移动设备上运行。

Gemini的一个突出特点是其复杂的多模态推理能力，使其能够从大规模数据集中精确提取见解。该模型的能力还包括理解和生成流行编程语言中的高质量代码。

然而，随着Google进入这个新的AI时代，责任和安全仍然至关重要。Gemini经过严格的安全评估，包括对偏见和有害性的评估。Google正在积极与外部专家合作，解决潜在的盲点，并确保模型的道德部署。

Gemini 1.0现已在各种Google产品中推出，包括Bard聊天机器人，并计划将其整合到Search、Ads、Chrome和Duet AI中。然而，Bard升级版在欧洲尚未获得监管机构的批准，因此暂不发布。

开发人员和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。Android开发人员还可以通过Android 14中的新系统功能AICore使用Gemini Nano进行构建。

（图片来源：Google）

标签：ai、artificial intelligence、bard、deepmind、gemini、gemini nano、gemini pro、gemini ultra、google gemini、model、multimodal

相关文章