三位作者已对人工智能初创公司Anthropic提起诉讼,指控该公司在未获许可的情况下使用他们的版权作品来训练其Claude语言模型。
安德烈亚·巴茨(Andrea Bartz)、查尔斯·格雷伯(Charles Graeber)和柯克·华莱士·约翰逊(Kirk Wallace Johnson)在加利福尼亚州法院提起诉讼,指控Anthropic“盗用”他们的书面材料来开发其人工智能系统。作者们声称,Anthropic从非法网站下载了他们书籍的盗版版本作为训练数据。
诉讼称,Anthropic“通过盗窃数十万本版权书籍建立了一个价值数十亿美元的企业。”诉状指出,该公司“无视版权保护”,并参与“大规模盗窃版权作品”,以训练其Claude模型。
Anthropic尚未对这些指控作出实质性回应,仅表示其“知晓”这一法律行动。此案与针对其他人工智能公司(如微软和OpenAI)因使用版权材料开发大型语言模型而提起的类似诉讼相似。它突显了内容创作者与人工智能公司之间在知识产权方面日益紧张的关系。
根据诉状,Anthropic使用了一个名为“堆栈”(The Pile)的数据集来训练Claude。该数据集据称包含一个名为“Books3”的盗版电子书集合,其中包含近20万本从未经授权的来源下载的书籍。
作者们认为,Anthropic知道自己在使用未经许可的版权作品。他们声称,该公司做出了“故意决定,选择走捷径,依赖被盗材料来训练其模型”,而不是获得适当的许可证。
诉状指出,Anthropic的行为损害了作者的利益,使他们失去了书籍销售和许可收入。它声称,该公司的人工智能模型现在与人类创作的内容竞争,威胁到作家的生计。
作为背景,Anthropic将其Claude模型定位为OpenAI的ChatGPT和其他知名人工智能聊天机器人的竞争对手。该公司已筹集数十亿美元的资金,估值超过180亿美元。
批评者认为,人工智能公司应对使用其作品作为训练数据的作者和出版商进行补偿。一些公司如谷歌已开始与新闻机构和其他内容提供商达成许可协议。
然而,人工智能开发者认为,使用版权材料进行机器学习属于版权法的“合理使用”条款。他们辩称,他们的模型并不复制训练文本的精确副本。
这一辩论涉及到关于版权如何适用于人工智能开发的复杂法律和伦理问题。法院可能需要确定人工智能训练是否构成版权侵权或变革性合理使用。
对于作者而言,这起诉讼代表了对其作品在人工智能开发中使用方式的控制权的主张。他们认为,利用人工智能获利的公司应对使该技术成为可能的创作者进行补偿。
如果法院裁定公司必须为所有用于训练的版权材料获得许可证,此案可能对人工智能行业产生重大影响。这可能会增加人工智能开发的成本和复杂性。
Anthropic专注于开发“安全和伦理”的人工智能系统。该公司的首席执行官将其描述为“专注于公共利益”。然而,作者的诉讼挑战了这一形象,指控Anthropic通过侵犯版权来建立其业务。
诉状寻求对涉嫌故意侵犯版权的法定赔偿和禁止Anthropic在未获许可的情况下进一步使用作者作品的禁令。
随着人工智能能力的增长,关于知识产权的辩论可能会加剧。内容创作者认为,他们的作品应受到保护并获得补偿,而人工智能公司则推动获取广泛的数据集以改善其模型。
像对Anthropic这样的案件的结果可能有助于塑造人工智能开发的法律和监管环境。它可能会影响公司在训练数据收集方面的做法,以及广泛许可是否成为常态。
目前,这起诉讼增加了主要人工智能公司在使用版权材料方面面临的法律挑战。随着法院对这些问题的审理,其裁决可能对人工智能和内容创作的未来产生深远影响。
该案以安德烈亚·巴茨等人诉Anthropic PBC为名,提交至加利福尼亚北区美国地方法院,案号为3:24-cv-05417。
(照片由Anthropic提供)
另见:Anthropic称Claude 3 Haiku是同类中最快的模型
想了解更多关于行业领袖的人工智能和大数据信息吗? 请查看AI & Big Data Expo,该活动将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议、区块链博览会、数字化转型周和网络安全与云博览会。
探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里。