“Meta被指控在人工智能开发中使用盗版数据”

Kadrey et al. vs. Meta 案件中,原告已提交一项动议,指控该公司在其人工智能模型的开发中故意使用受版权保护的作品。

原告包括作家理查德·卡德雷(Richard Kadrey),他们在加利福尼亚北区美国地方法院提交了“支持原告申请提交第三次修订合并诉状的回复”。

该文件指控Meta系统性地下载和剥离来自盗版数据集的版权管理信息(CMI),包括来自臭名昭著的影子图书馆LibGen的作品。

根据最近提交给法院的文件,证据揭示了涉及Meta高级领导的高度有罪的行为。原告声称,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)明确批准使用LibGen数据集,尽管公司人工智能高管提出了内部担忧。

2024年12月的一份内部备忘录承认LibGen是“我们知道是盗版的数据集”,并就使用此类材料的伦理和法律后果展开了辩论。文件还显示,顶级工程师在下载数据集时犹豫不决,担心使用公司笔记本电脑进行潜在非法活动。

此外,内部通讯表明,在获取LibGen数据集后,Meta剥离了包含在内的受版权保护作品的CMI——这一做法是原告强调的版权侵权指控的核心。

根据Meta的企业代表迈克尔·克拉克(Michael Clark)的证词,该公司实施了旨在删除任何识别这些作品为受版权保护的信息的脚本,包括“版权”、“致谢”或常用于此类文本的行。克拉克证实,这一做法是故意的,目的是为Meta的Llama人工智能模型的训练准备数据集。

“感觉不对”

对Meta的指控描绘了一幅该公司故意参与通过下载盗版内容进行广泛盗版计划的画面。

根据作为证据的电子邮件串,Meta工程师对在公司空间内下载盗版数据集的外部形象表示担忧。一位工程师指出,“从[Meta拥有的]公司笔记本电脑下载种子感觉不对”,但尽管犹豫,盗版数据的快速下载和分发——或称为“播种”——仍然发生。

原告的法律顾问表示,直到2024年1月,Meta“已经下载(包括下载和分发)来自LibGen的数据”。此外,记录显示,数百份相关文件在几个月前就已被Meta获取,但在早期发现过程中被隐瞒。原告认为,这种延迟披露构成了Meta阻碍获取重要证据的恶意行为。

在2024年12月17日的证词中,扎克伯格本人据报道承认,这种活动会引发“许多红旗”,并表示这“似乎是件坏事”,尽管他对Meta更广泛的人工智能训练实践提供了有限的直接回应。

此案最初是代表作者和出版商提起的知识产权侵权诉讼,声称与人工智能使用其材料有关的违规行为。然而,原告现在寻求在诉讼中增加两个主要指控:违反《数字千年版权法案》(DMCA)和违反《加利福尼亚综合数据访问和欺诈法》(CDAFA)。

根据DMCA,原告主张Meta故意删除版权保护,以掩盖其Llama模型中对受版权保护文本的未经授权使用。

在投诉中提到,Meta据称剥离CMI“以减少模型记住这些数据的机会”,并且这种删除版权管理指示的做法使得版权持有者更难发现侵权行为。

CDAFA的指控涉及Meta获取LibGen数据集的方法,包括据称通过下载获取未经许可的受版权保护数据集。内部文件显示,Meta工程师公开讨论了播种和下载可能被认为“法律上不合适”的担忧。

Meta案件可能影响人工智能开发的相关立法

这场不断扩大的法律斗争的核心在于对版权法与人工智能交集的日益关注。

原告认为,从文本数据集中剥离版权保护剥夺了版权拥有者的合法补偿,并允许Meta在作者和出版商的创作努力的经济废墟上构建像Llama这样的人工智能系统。

这些指控的时机恰逢全球对“生成性人工智能”技术的高度关注。像OpenAI、谷歌和Meta这样的公司都因使用受版权保护的数据来训练其模型而受到批评。各个司法管辖区的法院目前正在努力应对人工智能对权利管理的长期影响,可能在美国和英国作出具有里程碑意义的裁决。

在这个特定案件中,美国法院对听取关于人工智能可能对长期确立的版权法先例造成伤害的投诉表现出越来越大的意愿。原告在其动议中提到了 The Intercept Media v. OpenAI,这是纽约最近的一项裁决,其中类似的DMCA指控被允许继续进行。

Meta继续否认案件中的所有指控,并尚未对扎克伯格的证词声明作出公开回应。

无论原告是否成功进行这些修正,全球的作者们都面临着对他们的创作作品在人工智能背景下如何处理的日益担忧。随着版权法难以跟上技术进步,这一案件强调了在国际层面上提供更清晰指导以保护创作者和创新者的必要性。

对Meta而言,这些指控也代表着声誉风险。随着人工智能成为其未来战略的核心,依赖盗版库的指控不太可能有助于其在该领域保持领导地位的雄心。

正在展开的 Kadrey et al. vs. Meta 案件可能对未来人工智能模型的发展产生深远影响,可能在美国及其他地区设定法律先例。

(照片由 Amy Syiek 提供)

另见:英国希望证明人工智能可以负责任地现代化公共服务

想了解更多行业领袖关于人工智能和大数据的见解吗? 请查看人工智能与大数据博览会,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议区块链博览会数字转型周网络安全与云博览会

探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里

标签: , , , , , , , , , , ,