开源倡议(OSI)已公布一个定义框架,以评估AI系统是否可以被归类为开源。
首次开源AI定义(OSAID)的公告是在All Things Open上发布的,标志着一项跨越多年的全球努力的完成,该努力包括多次研究、国际研讨会和为期一年的社区设计过程。
OSI被广泛认为是全球个人、组织和政府机构对开源定义的权威,经过与行业利益相关者的广泛合作,制定了这一框架。该框架定义了开源AI的含义,强调无论是完全功能的AI系统、模型、权重和参数,还是其他结构元素,都必须适用相同的开源要求。
开源AI系统必须在授予四项基本自由的条款下提供:
- 出于任何目的使用该系统,且无需请求许可。
- 研究系统的工作原理并检查其组件。
- 出于任何目的修改该系统,包括更改其输出。
- 分享该系统供他人使用,无论是否修改,出于任何目的。
这些自由适用于完全功能的系统和系统的离散元素。行使这些自由的前提是能够访问用于修改系统的首选形式,包括详细的数据资料、完整的源代码和模型参数。
“导致开源AI定义1.0版本的共同设计过程是经过充分发展、全面、包容和公平的,”OSI董事会主席Carlo Piana表示。“董事会相信,该过程产生的定义符合开源定义和四项基本自由的标准。”
该框架最重要的要求之一是要求开源模型提供足够的信息关于其训练数据,确保“熟练的人可以使用相同或类似的数据重建一个实质上等效的系统,”Mozilla的AI战略负责人Ayah Bdeir表示。
Bdeir承认,尽管这种方法可能并不完美,但它代表了意识形态纯粹性与现实世界实施之间的实际妥协。她建议,要求不切实际的高标准可能会对该倡议的目标产生反效果。
数字公共产品联盟(DPGA)对OSI在定义开源AI方面的领导表示支持。DPGA秘书处首席执行官Liv Marte Nordhaug确认,她的组织将把这项基础性工作纳入对其AI应用数字公共产品标准的更新中。
EleutherAI Institute,以其在AI开发中的非营利工作而闻名,也支持该定义。
“开源AI定义是推动开源原则在AI领域的好处的必要步骤,”EleutherAI Institute执行董事Stella Biderman表示。“我们相信,这一定义支持独立机器学习研究人员的需求,并促进最大AI开发者之间的更大透明度。”
该定义强调在分享开源模型和权重时包含数据资料和代码的重要性。这些要求确保了透明度和修改AI系统的能力。
OSI执行董事Stefano Maffulli承认,在开发过程中面临的挑战,指出尽管偶尔有激烈的争论和不同的意见,最终结果与项目的初始目标一致。
“这是一个继续努力与社区互动以改善定义的起点,”他说。
OSAID并不要求特定的法律机制来确保模型参数对所有人自由可用,尽管这可能涉及许可证或法律工具。随着法律系统对这些开源AI系统的处理,这一方面预计会随着时间的推移变得更加清晰。
想了解更多来自行业领导者的AI和大数据信息吗? 请查看AI & 大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议、区块链博览会、数字转型周和网络安全与云博览会。
探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里。