Meta推出了Llama 3,这是其最新一代的开源大型语言模型(LLM)。这家科技巨头声称,Llama 3在实际应用场景中超越了之前的行业领先模型,如GPT-3.5,建立了新的性能基准。
Meta在发布的博文中表示:“通过Llama 3,我们致力于构建与当今最佳专有模型相媲美的最佳开源模型。”
首批开放的Llama 3模型包括80亿和700亿参数版本。Meta表示,其团队仍在训练更大的4000亿+参数模型,并将在未来几个月内发布,并详细介绍相关工作的研究论文。
Llama 3经过两年多的研发,投入了大量资源来收集高质量的训练数据,扩展分布式训练,优化模型架构,并采用创新方法进行指令微调。
Meta的700亿参数指令微调模型在12个关键使用场景(如编码、推理和创意写作)的人类评估中,表现优于GPT-3.5、Claude和其他具有可比规模的LLM。该公司的80亿参数预训练模型在流行的LLM评估任务上也创造了新的基准。
Meta通过“默认开放”的方式发布这些模型,以促进AI开发的开放生态系统。Llama 3将在所有主要云提供商、模型主机、硬件制造商和AI平台上提供。
Iris.ai的CTO兼联合创始人Victor Botev表示:“随着全球向AI监管的转变,Meta的Llama 3模型的发布是值得注意的。通过开源来拥抱透明度,Meta与对负责任的AI实践和道德开发的日益重视保持一致。”
随着Meta最新模型的发布,还推出了更新的AI安全工具套件,包括用于分类风险的Llama Guard的第二个版本和用于评估潜在滥用的CyberSec Eval的第二个版本。还引入了一个名为Code Shield的新组件,用于在推理时过滤不安全的代码建议。
然而,Botev继续表示:“然而,保持透明度并不意味着模型自动具备道德AI。解决AI的挑战需要综合性的方法,包括解决数据隐私、算法偏见和社会影响等问题,这些是全球新兴AI法规的重点。”
Meta表示,它采用了“系统级方法”来负责任地开发和部署Llama 3。虽然这些模型经过了广泛的安全测试,但该公司强调开发人员应根据其应用程序的要求实施自己的输入/输出过滤。
Meta AI是Meta集成Llama 3的最终用户产品,Meta声称由于新模型的加入,Meta AI现在是全球领先的AI助手。用户可以通过Facebook、Instagram、WhatsApp、Messenger和Web访问Meta AI,用于生产力、学习、创造力和一般查询。
Meta AI的多模态版本将集成视觉功能,并将在Meta的Ray-Ban智能眼镜上提供早期预览。
尽管Llama 3取得了可观的成就,但一些AI领域的人士对Meta以“造福社会”的开放方式表示怀疑。
然而,就在Mistral AI创造了开源模型的新基准(Mixtral 8x22B)的一天后,Meta的发布再次提高了公开可用的LLM的标准。
想要从行业领导者那里了解更多关于AI和大数据的知识吗?请参加在阿姆斯特丹、加利福尼亚和伦敦举办的AI & Big Data Expo。这个综合性的活动与其他领先的活动同时举办,包括BlockX、Digital Transformation Week和Cyber Security & Cloud Expo。
探索由TechForge提供支持的其他即将举行的企业技术活动和网络研讨会,请点击这里。
标签:ai、人工智能、大型语言模型、llama 3、llm、meta、开源