AI时代下的版权风险与解决途径 - 知乎

直播 04-14 阅读:493 评论:0
AI时代下的版权风险与解决途径 - 知乎

  1. Open AI的版权盾:为用户“执盾”

  11月7日,Open AI于开发者大会上推出了“Copyright Shield(版权盾)”服务,为AI大模型的版权问题提供了新思路。这项服务实质上是一种赔偿条款,当用户使用产品Chat GPT面临版权侵权法律索赔时,Open AI承诺将介入辩护,并承担法律费用。这类侵权包赔的模式在前期训练数据合规的情况下具备可行性。对于已经做好版权保障的公司,采取这种模式是合理且可行的。然而,如果著作权人未对训练数据授权,公司在面对纠纷时既需支付侵权赔偿,又需承担停止侵权的法律责任。Open AI开发者大会,图源网络

  Open AI的“Copyright Shield(版权盾)”服务不仅在公司系统中内置了版权保护措施,还为用户提供了一种赔偿的新选择。当用户使用Chat GPT生成文章面临版权侵权指控时,Open AI会为公司提供素材来源、内容生成过程等证据,同时承担判定侵权后的赔偿金。这一承诺主要针对Chat GPT Enterprise的用户和开发者平台的使用者,对普通用户不提供赔偿。

  类似的版权包赔模式并非Open AI独有,其他公司如谷歌、微软、亚马逊、Getty Images、Shutterstock、Adobe等也向企业级用户承诺支付大模型使用所涉版权纠纷的诉讼费用。这种趋势体现了对于AI技术应用中版权问题的广泛关切,以及对用户合法权益的重视。

  2. AI领域版权纠纷案例:AI版权“战火不断”

  AI领域的版权纠纷主要分为两大类,一类涉及模型训练阶段,认为作品被用于最初的模型训练,每一项AI输出都是侵权衍生品;另一类集中在输出端,认为AI生成的作品复制、模仿了原作品的内容和风格。其中,硅谷地区法院自2022年以来已受理了至少10起关于大模型训练数据的版权起诉。今年9月,17名作家向Open AI发起集体诉讼,指控未经许可大量复制原告的作品用于模型训练。

  1月23日,美国三名漫画家针对包括Stability AI在内的三家AIGC商业应用公司,在加州北区法院发起集体诉讼,指控Stability AI研发的Stable Diffusion模型以及三名被告各自推出的、基于上述模型开发的付费AI图像生成工具构成版权侵权。

  Stable Diffusion模型引发的版权争议涉及两个关键阶段。在训练阶段,模型使用版权作品训练内部组件,包括“图像编码器”和“Clip文本编码器”,并通过输入描述性文字生成对应的图像内容。在应用阶段,经过充分训练后,用户根据文本输入可获得最终的图像输出,然而,这些生成的图像很可能包含训练数据中的版权作品元素和特征。Stable Diffusion原理图,图源网络

  另外,在2月15日《华尔街日报》记者弗朗西斯科·马可尼(Francesco Marconi)也公开指责,Open AI公司未经授权大量使用路透社、纽约时报、卫报、BBC等国外主流媒体的文章训练Chat GPT模型,但从未支付任何费用。根据 OpenAI 公司的透露,他们在训练过程中使用45TB的数据,包含近1万亿个单词,这个数字差不多抵得上牛津词典单词量的 1300 倍。图源:Bing AI

  这些诉讼通常涉及AI模型训练所使用的数据来源,包括公共数据集、公共网站、自有数据、众包数据等。其中一个核心问题是模型训练数据的版权问题,特别是是否经过合法授权。针对输出端,多起诉讼主张生成的作品与原作品构成实质性相似,从而构成侵权。这使得版权问题成为AI技术应用的障碍之一。

  3. AIGC中美版权保护认定

  在ChatGPT和Midjourney最新版相继发布之后,美国版权局于2023年3月16日,就含有人工智能生成内容(AIGC)的作品发布了版权注册指南:版权只保护人类创造力的产物。最根本的是,在宪法和版权法中,“作者”一词将非人类排除在外。在包含有AIGC的作品中,美国版权局将会考虑AI的贡献是“机械复制”的结果,还是作者“自己最初的思想概念,(作者)赋予了可见的形式”。在申请版权登记时,如AIGC超过了允许的标准,则必须对AIGC提供一段简短描述。美国版权登记指南,图源美国版权局官网

  2022年9月,卡什塔诺娃为自己的漫画书《黎明的曙光》申请版权保护,但没有透露书中的插图由AI创作。今年2月21日美国版权局称,艺术家克里斯蒂娜·卡什塔诺娃写了一本名为《Zarya of the Dawn》的漫画书,虽然书的内容受版权保护,但她用Midjourney制作的AI图片不受保护。卡什塔诺娃作品中的AI生成的插图,图源网络

  在中国,《著作权法》第三条规定:“本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。由此可见,受到著作权法保护的作品需要同时满足以下三点:

  (1)具有独创性;

  (2)属于文学、艺术、科学领域;

  (3)能够以一定形式表现的智力成果。

  如果人工智能生成物被认为不属于人的智力成果,则不属于著作权法可保护的作品,比如可以认为属于公有领域的产品,有可能就不存在侵害他人著作权的问题。

  4. 多方应对“达摩克利斯之剑”

  当前,AI领域的版权问题尚未有明确的规定和权责划定。AIGC工具提供商采取多种机制以应对法律不确定性,包括提供版权包赔承诺、强调合规意识,以及向创作者提供经济报酬。一些公司在训练伊始就强调合规,另一些公司则表示向愿意将自己的作品用于AI模型训练的创作者提供经济报酬。图源:Bing AI

  Adobe和Shutterstock等公司从初始数据输入环节就注重合规性。Adobe表示其AI应用Firefly的训练数据集来自公开许可的作品和版权已过期的公共领域内容。此外,Shutterstock推出了贡献者计划,向提供独特图像的摄影师支付报酬。这些公司的做法旨在在法律和伦理框架内操作,强调与创作者的合作关系。

  5. 国内公司的回应

  国内公司对AI版权问题的回应也呈现多样化的趋势。一些公司在面临侵权争议时强调未使用用户作品,若确有侵犯则承担一定赔偿责任。另一些公司则采取分成补偿模型,为提供训练数据的作者提供经济报酬。这些公司不仅关注产品合规,也通过经济激励和法律声明等方式,尽量减少侵权风险。图源:Bing AI

  当前,我国在AI领域的版权政策和法规亟待完善。对于AI技术产生的作品是否受到著作权法的保护,是否认定为人的智力成果,还需在法规层面进行明确。政府、行业协会、企业和创作者之间需要加强沟通,共同努力建立一个明确、公正、合理的版权保护体系。

  结语

  在AI技术快速发展的时代,解决版权问题成为保障创作者权益和推动AI应用发展的关键一步。各国针对AI领域的版权政策和法规亟待完善,而AIGC公司也需要采取更创新的方式,确保AI训练数据和生成内容的版权合规性,以应对未来的法律挑战。在法律不确定性下,各方需要共同努力,为AI创新和版权保护建立更健康的生态。

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

网友评论

相关推荐

文章排行

标签列表