AI时代下的版权风险与解决途径 - 知乎

直播 04-14 阅读：493 评论：0

　　1. Open AI的版权盾：为用户“执盾”

　　11月7日，Open AI于开发者大会上推出了“Copyright Shield（版权盾）”服务，为AI大模型的版权问题提供了新思路。这项服务实质上是一种赔偿条款，当用户使用产品Chat GPT面临版权侵权法律索赔时，Open AI承诺将介入辩护，并承担法律费用。这类侵权包赔的模式在前期训练数据合规的情况下具备可行性。对于已经做好版权保障的公司，采取这种模式是合理且可行的。然而，如果著作权人未对训练数据授权，公司在面对纠纷时既需支付侵权赔偿，又需承担停止侵权的法律责任。Open AI开发者大会，图源网络

　　Open AI的“Copyright Shield（版权盾）”服务不仅在公司系统中内置了版权保护措施，还为用户提供了一种赔偿的新选择。当用户使用Chat GPT生成文章面临版权侵权指控时，Open AI会为公司提供素材来源、内容生成过程等证据，同时承担判定侵权后的赔偿金。这一承诺主要针对Chat GPT Enterprise的用户和开发者平台的使用者，对普通用户不提供赔偿。

　　类似的版权包赔模式并非Open AI独有，其他公司如谷歌、微软、亚马逊、Getty Images、Shutterstock、Adobe等也向企业级用户承诺支付大模型使用所涉版权纠纷的诉讼费用。这种趋势体现了对于AI技术应用中版权问题的广泛关切，以及对用户合法权益的重视。

　　2. AI领域版权纠纷案例：AI版权“战火不断”

　　AI领域的版权纠纷主要分为两大类，一类涉及模型训练阶段，认为作品被用于最初的模型训练，每一项AI输出都是侵权衍生品；另一类集中在输出端，认为AI生成的作品复制、模仿了原作品的内容和风格。其中，硅谷地区法院自2022年以来已受理了至少10起关于大模型训练数据的版权起诉。今年9月，17名作家向Open AI发起集体诉讼，指控未经许可大量复制原告的作品用于模型训练。

　　1月23日，美国三名漫画家针对包括Stability AI在内的三家AIGC商业应用公司，在加州北区法院发起集体诉讼，指控Stability AI研发的Stable Diffusion模型以及三名被告各自推出的、基于上述模型开发的付费AI图像生成工具构成版权侵权。

　　Stable Diffusion模型引发的版权争议涉及两个关键阶段。在训练阶段，模型使用版权作品训练内部组件，包括“图像编码器”和“Clip文本编码器”，并通过输入描述性文字生成对应的图像内容。在应用阶段，经过充分训练后，用户根据文本输入可获得最终的图像输出，然而，这些生成的图像很可能包含训练数据中的版权作品元素和特征。Stable Diffusion原理图，图源网络

　　另外，在2月15日《华尔街日报》记者弗朗西斯科·马可尼（Francesco Marconi）也公开指责，Open AI公司未经授权大量使用路透社、纽约时报、卫报、BBC等国外主流媒体的文章训练Chat GPT模型，但从未支付任何费用。根据 OpenAI 公司的透露，他们在训练过程中使用45TB的数据，包含近1万亿个单词，这个数字差不多抵得上牛津词典单词量的 1300 倍。图源：Bing AI

　　这些诉讼通常涉及AI模型训练所使用的数据来源，包括公共数据集、公共网站、自有数据、众包数据等。其中一个核心问题是模型训练数据的版权问题，特别是是否经过合法授权。针对输出端，多起诉讼主张生成的作品与原作品构成实质性相似，从而构成侵权。这使得版权问题成为AI技术应用的障碍之一。

　　3. AIGC中美版权保护认定

　　在ChatGPT和Midjourney最新版相继发布之后，美国版权局于2023年3月16日，就含有人工智能生成内容（AIGC）的作品发布了版权注册指南：版权只保护人类创造力的产物。最根本的是，在宪法和版权法中，“作者”一词将非人类排除在外。在包含有AIGC的作品中，美国版权局将会考虑AI的贡献是“机械复制”的结果，还是作者“自己最初的思想概念，（作者）赋予了可见的形式”。在申请版权登记时，如AIGC超过了允许的标准，则必须对AIGC提供一段简短描述。美国版权登记指南，图源美国版权局官网

　　2022年9月，卡什塔诺娃为自己的漫画书《黎明的曙光》申请版权保护，但没有透露书中的插图由AI创作。今年2月21日美国版权局称，艺术家克里斯蒂娜·卡什塔诺娃写了一本名为《Zarya of the Dawn》的漫画书，虽然书的内容受版权保护，但她用Midjourney制作的AI图片不受保护。卡什塔诺娃作品中的AI生成的插图，图源网络

　　在中国，《著作权法》第三条规定：“本法所称的作品，是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。由此可见，受到著作权法保护的作品需要同时满足以下三点：

　　（1）具有独创性；

　　（2）属于文学、艺术、科学领域；

　　（3）能够以一定形式表现的智力成果。

　　如果人工智能生成物被认为不属于人的智力成果，则不属于著作权法可保护的作品，比如可以认为属于公有领域的产品，有可能就不存在侵害他人著作权的问题。

　　4. 多方应对“达摩克利斯之剑”

　　当前，AI领域的版权问题尚未有明确的规定和权责划定。AIGC工具提供商采取多种机制以应对法律不确定性，包括提供版权包赔承诺、强调合规意识，以及向创作者提供经济报酬。一些公司在训练伊始就强调合规，另一些公司则表示向愿意将自己的作品用于AI模型训练的创作者提供经济报酬。图源：Bing AI

　　Adobe和Shutterstock等公司从初始数据输入环节就注重合规性。Adobe表示其AI应用Firefly的训练数据集来自公开许可的作品和版权已过期的公共领域内容。此外，Shutterstock推出了贡献者计划，向提供独特图像的摄影师支付报酬。这些公司的做法旨在在法律和伦理框架内操作，强调与创作者的合作关系。

　　5. 国内公司的回应

　　国内公司对AI版权问题的回应也呈现多样化的趋势。一些公司在面临侵权争议时强调未使用用户作品，若确有侵犯则承担一定赔偿责任。另一些公司则采取分成补偿模型，为提供训练数据的作者提供经济报酬。这些公司不仅关注产品合规，也通过经济激励和法律声明等方式，尽量减少侵权风险。图源：Bing AI

　　当前，我国在AI领域的版权政策和法规亟待完善。对于AI技术产生的作品是否受到著作权法的保护，是否认定为人的智力成果，还需在法规层面进行明确。政府、行业协会、企业和创作者之间需要加强沟通，共同努力建立一个明确、公正、合理的版权保护体系。

　　结语

　　在AI技术快速发展的时代，解决版权问题成为保障创作者权益和推动AI应用发展的关键一步。各国针对AI领域的版权政策和法规亟待完善，而AIGC公司也需要采取更创新的方式，确保AI训练数据和生成内容的版权合规性，以应对未来的法律挑战。在法律不确定性下，各方需要共同努力，为AI创新和版权保护建立更健康的生态。