OpenAI在与新闻媒体的版权战事中获得了首轮胜利,不过是暂时的。
11月7日,美国纽约南区地方法院驳回了新闻媒体 Alternet 和 Raw Story 起诉 OpenAI 的案件。两家媒体在今年2月联合起诉,指控OpenAI在给大模型投喂训练数据时删除了版权信息,而且ChatGPT可以在不说明来源的情况下,根据版权内容输出回复。
两家媒体因此对每起侵权行为索赔至少2500美元,并寻求禁令救济,阻止OpenAI继续使用它们的版权作品。此外,它们还要求OpenAI 从训练数据集中删除所有受版权保护的材料。
上周四,纽约南区地方法院驳回了Alternet 和 Raw Story 提起的诉讼。法官最终认为,原告没有证明它们因版权信息被删除而遭受了哪些具体伤害,不满足提起诉讼的条件。
需要注意的是,受访专家告诉21记者,即使这次是OpenAI的胜利,也只是一次有限的胜利,因为该案并没有回应AI领域最白热化的争议——公司使用版权素材训练AI,到底需不需要获得版权方授权?对于这一问题,中美两国的法院目前都还没有给出答案。
尽管诉讼被驳回,但Raw Story 和 AlterNet 并未打算放弃。原告律师在接受媒体采访时表示,他们有信心通过重新修订起诉书,继续维权。判决书也透露出法官愿意考虑重新提起诉讼的信号。
核心争议:版权管理信息
与其他诉讼不同的是,原告Raw Story 和 AlterNet并没有直接主张OpenAI侵犯了版权,而是指控其违反了版权管理信息(CMI)的相关条款。
两家媒体在诉讼书中写道,OpenAI 擅自抓取数千篇新闻报道,并在输入大模型训练时删除了版权管理信息(CMI)——包括作者姓名、作品使用条款和条件以及作品标题。它们还指出ChatGPT在生成回答时,通常也不提供作品的作者、标题和版权信息。
根据美国《数字千年版权法》第1202(b) 条款,未经授权去除或更改版权管理信息(CMI) 的行为被视为版权侵犯。
另一边的OpenAI 则辩称,媒体出版商没有法律资格提出诉讼:一是因为它们没有证据证明ChatGPT 接受了它们的作品训练,二是没有证明因版权管理信息被删除,而遭受了哪些具体伤害。
法官最终认同了OpenAI的观点,并在判决书中补充道:“当用户向 ChatGPT 输入问题时,ChatGPT 会将其数据库中的相关信息合成回复。考虑到数据库的信息量,ChatGPT 输出原告文章内容的可能性似乎很小。”
上海大邦律师事务所高级合伙人、知识产权律师游云庭向21记者分析,原告只证明了自己的作品被包含在OpenAI的训练数据集中,但没有证明OpenAI是不是用了这些素材训练。他表示,在举证环节,原告一般会向AI定向提问,根据输出逆推输入素材。比如《权利的游戏》作者在起诉OpenAI时,让ChatGPT为《权力的游戏》续写大纲;有些艺术家会使用特定输入词,检测AI生成的图片是否包含自己作品的一些特征元素。
不过,举证始终是AI版权纠纷的一大难题。“大模型是一个黑盒,怎么才能证明它到底有没有拿你的素材?去做了哪些训练?拿我国的民事诉讼法来说,也缺少证据开示等帮助弱势当事方的制度。”此前天元律师事务所合伙人李昀锴向21记者表示。
李昀锴说,在技术黑盒的情况下,能让AI公司责任更轻、更稳妥的方案其实就是“闭口不谈”——只要AI公司不说,版权方就证明不了。此类困扰恐怕会一直存在。
值得一提的是,虽然本案法官认为原告不满足起诉条件,并且拒绝了重新起诉的请求,但判决书指出在特定情况下可以重新提起起诉。法官认为,本案利益攸关的地方不是版权信息被删除,而是“被告使用了原告的作品开发ChatGPT,却没有向原告支付赔偿金” ——也就是OpenAI需不需要为训练数据的版权付费
这又回到了版权战场的老叙事中。
未解之谜:合理使用问题
“即使这一次是OpenAI的胜利,也只是一次有限的胜利。本案判决并没有回应目前AI领域的核心争议。” 游云庭说,目前业内的目光焦点,也正是AI公司在使用版权素材进行训练的时候,到底需不需要获得授权。
公开资料里,OpenAI还有至少六起正在进行时态的版权官司:去年12月《纽约时报》打响了媒体版权战场的第一枪,声称ChatGPT可以逐字输出报道内容,《每日新闻》、非营利新闻机构调查报道中心、The Intercept三家媒体分别对OpenAI提起了同类诉讼;媒体之外,还有Youtube博主Millette指控OpenAI擅自转录了数百万个YouTube 视频来训练大模型,超过100人参与了集体诉讼;三名小说作者分别对 OpenAI 提起侵权诉讼,现已合并为针对OpenAI 和微软的一项诉讼。
以上诉讼的一个共同点是,都指控OpenAI擅自利用版权作品训练AI,侵犯了版权权利人的利益。
游云庭指出,对于这一争议,目前中美两国的法院都还没给出答案,但日本已经把其列为了“合理使用”行为。
日本《著作权法》允许AI在未经授权的情况下,利用包括报刊文章在内的版权作品,作为AI学习的材料。去年6月,日本文部科学(相当于国内教育部)大臣永冈桂子在当地会议上再次回应,称“在日本,无论使用何种方法,无论是出于营利或非营利目的,无论用于复制以外的行为,还是从非法网站获得的内容,都可以使用信息分析作品。”
广东财经大学法学院教授姚志伟此前告诉21记者,合理使用的理论在日本著作权法和美国的司法案件中有一定体现,但在中国法中没有立法依据,能否在司法上得到认可具有很强的不确定性。
除了版权官司,OpenAI近期负面动态频频,包括内部员工爆料下一代模型不及预期;人事变动频繁,安全团队高管接连离职。据外媒获得的财务文件,OpenAI 8月份的月收入达到3亿美元,自2023年初以来增长了1700%,预计今年的年销售额约为37亿美元。但有金融专业人士分析,在支付运营服务等其他成本费用后,公司预计今年将亏损约50亿美元。