起诉OpenAI持续发酵,多家媒体加入反抗队伍
继《纽约时报》起诉OpenAI后,美国三家数字新闻媒体于2月28日对OpenAI提起版权侵权诉讼。他们认为, OpenAI 违反了《数字千年版权法案》(Digital Millennium Copyright Act),记者的岗位正受到威胁,而OpenAI却利用记者的辛勤劳动盈利。
围绕OpenAI与《纽约时报》之间的版权侵权诉讼案争议仍在持续。2月29日,澎湃科技(www.thepaper.cn)注意到,近期又有多家新闻媒体对OpenAI提起了版权侵权诉讼。
据美联社报道,数字新闻媒体The Intercept、Raw Story和AlterNet日前正式加入了对抗人工智能未经授权使用其新闻内容的行列,并于2月28日对OpenAI提起了一项版权侵权诉讼。
这些媒体机构表示,他们数千篇报道被OpenAI用来训练聊天机器人,这些内容实际上是在未经许可、付费的情况下“搭便车”(piggybacking)借用了他们的新闻报道。
不过,起诉OpenAI的三家媒体并未提供他们声称被盗用的故事具体案例。
媒体集体控诉OpenAI
The Intercept的首席执行官安妮·查贝尔(Annie Chabel)表示,“在全国各地的新闻编辑室因财务削减而遭受重创的时候,OpenAI 却从我们的内容中获益。我们希望通过这起诉讼,能够向AI开发者发出强烈的信号。”
另据英国《卫报》2月28日报道,Raw Story 和 AlterNet 首席执行官约翰·伯恩( John Byrne) 在一份联合声明中表示:“Raw Story认为新闻机构必须勇敢地站出来面对OpenAI,因为 OpenAI 违反了《数字千年版权法案》(Digital Millennium Copyright Act),记者的岗位正受到威胁,而OpenAI却利用记者的辛勤劳动盈利”。
约翰·伯恩称,Raw Story和AlterNet 的诉讼不包括微软,OpenAI 和微软当下暂未表态。
科技巨头微软及其生成式人工智能合作伙伴 OpenAI 因旗下聊天机器人 ChatGPT 产生的司法纠纷缘起于《纽约时报》。
2023年12月,《纽约时报》以侵犯版权为由起诉OpenAI 及其合作伙伴微软,指控这两家公司未经许可使用其数百万篇文章以训练人工智能模型。不过,《纽约时报》在起诉中并未提出具体的赔偿金额要求,但指出被告OpenAI 应为“非法复制和使用《纽约时报》独特且有价值的作品”和与之相关的“价值数十亿美元的法定和实际损失”负责。
当地时间2024年2月26日,OpenAI要求美国联邦法院驳回《纽约时报》对公司部分诉讼的指控,声称《纽约时报》雇佣黑客通过违反OpenAI使用条款的方式,导致其重复生成《纽约时报》的文章内容,并利用该误导性证据来支持诉讼。
针对OpenAI的指控,《纽约时报》的代理律师伊恩·克罗斯(Ian Crosby)于2月27日回应称,该报只是利用OpenAI的产品查找证据,证明其非法复制了《纽约时报》的版权作品,而非实施所谓的“黑客行为”。
此外,《纽约时报》要求两家公司销毁任何使用到《纽约时报》版权材料的聊天机器人模型和训练数据。
大模型引发的数据问题
这波针对OpenAI的集体诉讼,反映了当前整个媒体行业对于人工智能技术的担忧。媒体的担忧主要集中在生成式人工智能将与成熟的出版商竞争,成为互联网用户的主要信息来源。这将进一步削减媒体的广告收入,并有损在线新闻质量。
业内知名安全专家、从事信息安全行业近20年的上海观安信息技术股份有限公司总经理张照龙日前在接受澎湃科技采访时表示,人工智能生成式大模型在应用过程当中,极易产生风险。“大模型是个知识化模型,如果所有前面的训练数据推演得好,可以把原来训练的敏感数据都还原出来。”他进一步指出,大模型还原程度大致在80%,差一点也有50%。
伴随着生成式大模型的发展,将会带来哪些数据问题?张照龙称,第一个问题是非法采集。张照龙称,模型训练的本质是“喂数据”。一些开放使用的平台,如果没有受到认证,或者有不合法的目的,可能会滥用采集到的数据及用户的个人信息。
此外,大模型本身是否安全也值得关注。张照龙称,即使模型是安全的,依然有人可以利用大模型反推原始数据。例如,有关数据大模型的很多企业在非法获取个人数据中的隐私信息、个人行为等,包括政府数据、行业和企业数据。因此,数据保护是否得当,数据来源是否合法,拿到数据是否会滥用、如何进行管理和控制,都是需要注意的问题。
数字媒介批评者、北京大学新闻与传播学院教授胡泳分析认为,《纽约时报》对OpenAI及微软的诉讼案和其他案例表明,法院目前正试图解决人工智能技术对版权、隐私和数据使用法律的复杂影响,法律格局也在不断变化之中。这场诉讼凸显了促进人工智能创新与保护版权之间错综复杂的平衡。
胡泳称,随着人工智能技术越来越多地展现出生成类人内容的能力,一个具有挑战性的问题也随之凸显:在不违反版权法的情况下,现有内容在多大程度上可用于人工智能开发。无论《纽约时报》起诉OpenAI结果如何,这场诉讼都可能对人工智能行业产生持久影响,影响人工智能公司、内容创作者和法律专家如何驾驭人工智能技术与版权法之间复杂的相互作用。它还将人工智能开发中的伦理考量的重要性推到了风口浪尖,强调了在各个领域负责任地合法使用人工智能技术的必要性。
分享1 |