出版业与AI巨头的版权博弈
近日,出版界两大巨头——大英百科全书(Britannica)与韦氏词典(Merriam-Webster)向纽约南区联邦法院提起诉讼,将科技巨头OpenAI告上法庭。原告方指控OpenAI在未获得授权的情况下,大规模抓取并利用其经过专家严谨编纂的版权内容来训练人工智能模型,从而构建起其市值高达7300亿美元的AI帝国。
“蚕食”流量与收入的恶性循环
在诉讼文件中,原告方明确指出,ChatGPT的运作模式正在“蚕食”出版商赖以生存的流量与广告收入。不同于传统搜索引擎通过链接将用户导向出版商网站,ChatGPT直接吸收并整合了出版商的内容,以“现成答案”的形式反馈给用户。这种做法不仅剥夺了网站的访问量,还导致出版商的营收能力大幅下降。
原告方担忧,这一模式将引发负面反馈循环:广告与订阅收入的下滑将导致出版商削减内容创作预算,进而造成内容质量下降,最终导致流量进一步流失。这种恶性循环可能对知识产权持有者造成毁灭性打击。
拒绝授权后的法律反击
据诉状披露,早在2024年11月,原告方曾试图与OpenAI就潜在的授权协议进行协商,但遭到了对方的拒绝。此次起诉,原告方不仅要求OpenAI赔偿因侵权行为获取的“非法利润”,还根据《兰姆法案》(Lanham Act)指控OpenAI存在虚假标注问题——即当ChatGPT产生幻觉或编造内容时,有时会错误地将信息归咎于这些权威出版机构。
原告方目前正寻求法院颁布永久禁令,禁止OpenAI继续使用其受版权保护的材料。
抄袭与“内容策展”的争议
诉讼中列举了多个具体案例,直指ChatGPT存在直接“抄袭”行为。例如,当用户要求ChatGPT定义“剽窃”(plagiarize)一词时,模型给出的答案与韦氏词典的版权定义完全一致。此外,在关于历史事件(如汉密尔顿与伯尔决斗)的查询中,ChatGPT被指直接复制了大英百科全书文章中独特的观点选择和引语排序。
OpenAI的辩护词
面对指控,OpenAI发言人回应称,其AI模型旨在增强人类创造力、推动科学与医疗研究,并为数亿人的日常生活提供便利。OpenAI强调,其模型训练基于“公开数据”且符合“合理使用”(fair use)原则,是推动技术创新的必要手段。
此次诉讼是近年来AI行业面临的版权风暴的缩影。此前,已有包括作家、新闻机构在内的多个主体对OpenAI、Anthropic及Perplexity等AI公司提起诉讼。随着法律界对“何为公共知识”及“AI训练边界”的界定愈发关注,这场关于知识产权与人工智能未来发展的博弈,或将成为决定行业格局的关键转折点。