OpenAI发布了GPT-4 Turbo与Vision API的普遍可用性。

OpenAI宣布其强大的GPT-4 Turbo with Vision模型现已通过公司的API正式提供，为企业和开发人员提供了将先进的语言和视觉功能集成到其应用程序中的新机会。

GPT-4 Turbo with Vision的API发布是在去年9月首次发布GPT-4的视觉和音频上传功能以及在OpenAI的开发者大会上推出经过增强的GPT-4 Turbo模型之后进行的。

GPT-4 Turbo承诺显著提高速度，增加最多128,000个标记的输入上下文窗口（相当于约300页），并提供更具亲民性的价格供开发人员使用。

一个关键的改进是API请求能够通过文本格式JSON和函数调用来利用模型的视觉识别和分析能力。这使得开发人员可以生成能够自动化连接应用程序内的操作的JSON代码片段，例如发送电子邮件、进行购买或发布在线内容。然而，OpenAI强烈建议在对现实世界产生影响的操作之前建立用户确认流程。

一些初创公司已经在利用GPT-4 Turbo with Vision，包括Cognition，其AI编码代理Devin依赖于该模型自动生成完整的代码。

Healthify是一款健康和健身应用程序，它使用该模型根据餐食照片提供营养分析和建议。

总部位于英国的初创公司TLDraw利用GPT-4 Turbo with Vision来驱动其虚拟白板，并将用户的绘图转换为功能性网站。

尽管面临Anthropic的Claude 3 Opus和Google的Gemini Advanced等新模型的激烈竞争，API的发布应该有助于巩固OpenAI在企业市场上的地位，因为开发人员等待该公司的下一个大型语言模型。

（照片由v2osk提供）

想要从行业领导者那里了解更多关于人工智能和大数据的知识吗？请参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个综合性的活动与其他领先的活动同时举办，包括BlockX、Digital Transformation Week和Cyber Security & Cloud Expo。

探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会。

相关文章

“SingularityNET押注超级计算机网络以实现AGI”

‘ASI联盟推出AIRIS，在Minecraft中“学习”’

DeepMind框架在LLMs的推理方面取得突破

马斯克结束了对OpenAI的诉讼，同时批评了苹果的ChatGPT计划。