Primate Labs正式推出了Geekbench AI,这是一款专为机器学习和以AI为中心的工作负载设计的基准测试工具。
Geekbench AI 1.0的发布标志着经过多年的开发和与客户、合作伙伴及AI工程社区的合作的成果。该基准测试在预览阶段曾被称为Geekbench ML,现已重新命名,以符合行业术语并确保其目的的清晰性。
Geekbench AI现已通过Primate Labs网站以及Google Play商店和Apple App Store在Windows、macOS和Linux上提供,适用于移动设备。
Primate Labs最新的基准测试工具旨在提供一种标准化的方法,以测量和比较不同平台和架构的AI能力。该基准测试通过提供三个整体分数,反映了AI工作负载的复杂性和异质性,提供了一种独特的方法。
“简单来说,测量性能真的很难,”Primate Labs解释道。“这并不是因为运行任意测试很难,而是因为很难确定哪些测试对于你想要测量的性能最重要——尤其是在不同平台之间,特别是当每个人都以微妙不同的方式进行操作时。”
这三分制系统考虑了现代AI实现中存在的不同精度水平和硬件优化。这种多维方法使开发者、硬件供应商和爱好者能够更深入地了解设备在不同场景下的AI性能。
Geekbench AI的一个显著新增功能是为每个测试提供准确性测量。此功能承认AI性能不仅仅关乎速度,还关乎结果的质量。通过结合速度和准确性指标,Geekbench AI提供了对AI能力的更全面的视角,帮助用户理解性能与精度之间的权衡。
Geekbench AI 1.0引入了对广泛AI框架的支持,包括在Linux和Windows上的OpenVINO,以及在Android上支持特定供应商的TensorFlow Lite代理,如Samsung ENN、ArmNN和Qualcomm QNN。这种广泛的框架支持确保基准测试反映了AI开发者使用的最新工具和方法。
该基准测试还利用了更广泛和多样化的数据集,这不仅增强了准确性评估,还更好地代表了现实世界的AI使用案例。Geekbench AI 1.0中的所有工作负载至少运行一秒钟,允许设备在测试期间达到其最大性能水平,同时仍然反映现实世界应用的突发性特征。
Primate Labs已发布了Geekbench AI 1.0中使用的工作负载和模型的详细技术描述,强调其对透明度和行业标准测试方法的承诺。该基准测试与Geekbench浏览器集成,便于跨平台比较和结果共享。
该公司预计将定期更新Geekbench AI,以跟上市场变化和新兴AI功能。然而,Primate Labs认为,Geekbench AI已经达到了一个可靠的水平,适合集成到专业工作流程中,像Samsung和Nvidia等大型科技公司已经在使用该基准测试。
(图片来源: Primate Labs)
另请参见: xAI推出Grok-2以挑战AI层级
想了解更多来自行业领袖的AI和大数据信息吗? 请查看AI & 大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议、区块链博览会、数字化转型周和网络安全与云博览会。
探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里。