
泽康动态
你的位置:首页 > 泽康动态
泽康原创|探讨AI生图中参与者的权益
|
编辑:广东泽康律师事务所 发表日期: 2024-01-19
|
--从全国首例“文生图”一审判决判决生效,探讨AI美术作品在法律上的权利归属问题 “随着北京互联网法院全国首例“文生图”一审判决的生效,AI作品的著作权归属问题逐渐凸显。笔者将通过此案,与大家一同探讨法院对AI生成图片著作权的评价,以及当前AI生成图片领域存在的争议。” (一) 全国首例“文生图”一审判决概要 案 情 概 要 原告使用开源软件Stable Diffusion,通过输入提示词的方式生成了涉案图片后发布在小红书平台。被告在百家号上发布文章,文章配图使用了涉案图片。原告认为,被告未经许可使用涉案图片,且截去了原告在小红书平台的署名水印,使得相关用户误认为被告为该作品的作者,严重侵犯了原告享有的署名权及信息网络传播权,要求被告公开赔礼道歉、赔偿经济损失等。 被告辩称,不确定原告是否享有涉案图片的权利,被告所发布文章的主要内容为原创诗文,而非涉案图片,而且没有商业用途,不具有侵权故意。 涉案图片的生成过程 1.原告下载Stable Diffusion模型,随后在正向提示词与反向提示词中分别输入数十个提示词,设置迭代步数、图片高度、提示词引导系数以及随机数种子,生成第一张图片。 2.在上述参数不变的情况下,将其中一个模型的权重进行修改,生成第二张图片。 3.在上述参数不变的情况下,修改随机种子生成第三张图片。 4.在上述参数不变的情况下,增加正向提示词内容,生成第四张图片(即涉案图片)。 法院认为 01. 涉案图片符合作品的定义,属于作品 从涉案图片的外观上来看,其与通常人们见到的照片、绘画无异,显然属于艺术领域,具有一定的表现形式。涉案图片系原告利用生成式人工智能技术生成的,从原告构思涉案图片起,到最终选定涉案图片止,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等。涉案图片体现了原告的智力投入,因此涉案图片具备“智力成果”要件。 从涉案图片本身来看,体现出了与在先作品存在可以识别的差异性。从涉案图片生成过程来看,原告通过提示词对人物及其呈现方式等画面元素进行了设计,通过参数对画面布局构图等进行了设置,体现了原告的选择和安排。另一方面,原告通过输入提示词、设置相关参数,获得了第一张图片后,继续增加提示词、修改参数,不断调整修正,最终获得涉案图片,这一调整修正过程体现了原告的审美选择和个性判断。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达,因此涉案图片具备“独创性”要件。 涉案图片是以线条、色彩构成的有审美意义的平面造型艺术作品,属于美术作品,受到著作权法的保护。 02. 原告是涉案图片的作者,享有涉案图片的著作权 就涉案作品的权利归属而言,著作权法规定,作者限于自然人、法人或非法人组织,因此人工智能模型本身无法成为我国著作权法规定的作者。原告为根据需要对涉案人工智能模型进行相关设置,并最终选定涉案图片的人,涉案图片是基于原告的智力投入直接产生,而且体现出原告的个性化表达,因此原告是涉案图片的作者,享有涉案图片的著作权。 03. 被告侵害了原告享有的权利,应当承担侵权责任 被告未经许可,使用涉案图片作为配图并发布在自己的账号中,使公众可以在其选定的时间和地点获得涉案图片,侵害了原告就涉案图片享有的信息网络传播权。此外,被告将涉案图片进行去除署名水印的处理,侵害了原告的署名权,应当承担侵权责任。 裁 判 结 果 北京互联网法院作出一审判决,判决被告赔礼道歉并赔偿原告500元,双方均未提起上诉,目前一审判决已生效。 注释:上述内容及图片均转自北京互联网法院微信公众号 主 流 观 点 本案中,裁判人员对AI生成图片的操作过程进行了充分了解,并将其所了解的细节与现行著作权法律法规进行比对。据此,裁判人员认为原告在生成AI图片过程中存在智力投入,因此涉案图片符合“智力成果”的要求,应视为美术作品。同时,涉案图片直接源于原告的智力成果,且体现出其个性化表达,故原告系涉案图片的作者,享有著作权。 非 主 流 观 点 然而,目前存在另一种观点认为,对于原告在未经模型训练素材原作者及模型设计师前置授权,或前置授权不明确的情况下,其仅凭“智力”与“创造”是否能享有涉案图片的著作权,仍然存在争议。 鉴于AI图片生成器并非单一的生产工具,其在运行过程中所涉因素及关系主体错综复杂,只有明确AI如何生成图片、何种因素决定最终图像呈现,以及各方参与者对AI图片的参与程度,方能判断AI生成的图片是否符合我国法律对“作品”的定义,唯有清晰了解AI生成图片的原理,方能明确当事人的权属问题, (二) 什么是AI生成图片 “若要与大家一同探索争议之处,先要有共同的起点,然而AI图片生成作为前沿专业领域,受众范围有限,同时因特定原因使用门槛较高。为避免读者对AI生成图片的使用场景、生成原理及操作方式产生陌生或误解,下文将尽量客观地介绍AI生成图片技术的相关背景资料。” (一) 市面上主流AI生成图片工具 目前,Midjourney和案涉的Stable Diffusion是AI生成图片领域的两款备受推崇的生成器。它们的目标一致,是一种基于人工智能技术的图像生成工具,它能够根据已有的图片素材模型,生成与之一致风格的新图片。然而,它们在载体、使用平台、操作方式以及使用场景等方面存在显著差异。 Midjourney:选择在Discord平台上运行,用户只需在聊天窗口输入文字即可生成图像。但其高度的随机性降低了用户的操作空间,使用户无法准确预知生成的图片内容。此外,Midjourney采用收费模式,限制了部分用户的使用。 注释:上图为Midjourney操作界面 Stable Diffusion:则选择开源,允许用户免费使用,并允许他们在自己的电脑上搭建应用环境。与Midjourney相比,Stable Diffusion提供了丰富的参数调节选项,允许用户发挥更多“人为创意”,生成更符合需求的图片。 注释:上图为Stable Diffusion操作界面 (二) 案涉Stable Diffusion如何实现AI生图 1.Stable Diffusion的基本原理 Stable Diffusion其主要思想是将图像的生成看作是一个随机扩散过程。在这个过程中,图像的像素值会在一个固定范围内随机变化,直到达到一个平衡状态,从而生成最终的图像。与传统生成模型不同,Stable Diffusion不依赖于神经网络,而是采用了一种称为“稳定扩散”的数学模型。整个过程可以类比成把泥胚,塞进模具里,最后烧制出产品。 2.运行Stable Diffusion的参与者 Stable Diffusion在图片生成过程中,有四位关键角色不可或缺: A.开发者 他们负责Stable Diffusion图片生成器的整体规划和推进,确保各个阶段都能顺利进行,并且维护和升级Stable Diffusion的使用体验。 B.原作者(模型训练素材的提供者) 他们负责为Stable Diffusion提供训练模型需要的图像,图像供给系生成模型的必要条件,其所提供的图像系AI模型生成AI图片的规则及风格的关键。合法的模型训练素材的提供者,通常是该图像的原作者。 C.模型设计师 在AI图片生成中扮演着核心角色。他们负责收集大量具有多样性和代表性的图像,以保证模型能够学习到各种不同的图像特征。此外,模型设计师(C)还需要对图像数据进行预处理,例如缩放、裁剪和归一化等操作,以便于模型训练。 值得注意的是,模型设计师(C)在LoRA模型和ControlNet模型中的角色有所不同。在LoRA模型中,模型设计师(C)主要负责提供图像数据,而在ControlNet模型中,模型设计师(C)还需负责收集和整理控制信号。控制信号是一种附加信息,用于指导生成器生成特定类型的图像。例如,在图像编辑任务中,控制信号可以表示为目标图像的特定属性,如人脸表情、姿势等。通过引入控制信号,ControlNet模型能够实现更精细的图像编辑任务。他们主要负责设计和优化神经网络模型,以提升图片生成的质量和效率。 D.图片生成者 他们就是本案中原告的地位,在项目中起着至关重要的作用。他们是实际操作的关键,负责利用设计的模型进行图片生成。生成人不仅要有一定的技术水平,还需要熟悉操作Stable Diffusion的参数设置。他们需要根据项目的需求和标准,对生成的图片进行调整和优化,确保最终呈现的图片能满足预期。 (三) 被忽视的训练素材与模型 “图片生成者(D)的AI美术作品是否享有著作权,除了其“智力及创意“投入外,还应当有“AI模型”使用的合法性。” 而Stable Diffusion的AI模型究竟是如何制作出来的?又是如何运作的?模型对于认定权属问题为何重要? (一) Stable Diffusion的模型制作过程 1.模型设计师(C)将原作者(B)的图片素材进行整理,并批量上传至Stable Diffusion内置的模型训练器(或更专业的模型训练软件如:LoRA Easy Training Script)并预设训练参数。这一步骤是为了让训练器能够理解和转化这些图片的信息。 2.训练器收到图片素材后,会生成对抗规则数据。对抗生成网络能够在训练过程中,学习图片之间的风格传递和转换关系。 3.系统根据训练后的对抗生成网络,得出包含上传图片“风格”信息的LoRA模型或ControlNet模型文件。 这个过程相当于用原作者的美术作品为AI模型赋予了生成AI图片的美术风格及效果,专业领域被称为“喂图”。在此阶段,模型训练师(C)利用原作及数字技术,制作出一套能在Stable Diffusion运行的数据化模具。 (二) Stable Diffusion的模型运行操作过程 1.图片生成者(D)在Stable Diffusion目录下加载LoRA模型或ControlNet模型文件,并输入正反向关键词。这些关键词将作为生成新图片的指导方向。 2.Stable Diffusion模型根据加载的模型文件,以及图片生成者(D)输入的关键词,生成与上传模型信息极为相近的新图片。 综上,模型必须要用大量原作者的美术作品进行训练才能诞生,而模型对于生成AI图片的风格和效果起着决定性的作用。而且, 在实际操作中,一旦加载了AI模型,图片生成者(D)在未输入任何提示词及设置的情况下,仅需点击“生成”按钮,即可生成AI图片。然而,若未加载AI模型,即使关键词输入再多、参数调整再细,也无法生成AI图片。 (三) 毒树之果 值得注意的是,一般的图片生成者(D)为了提高效率,通常会直接从一些模型网站下载现成的LoRA模型和ControlNet模型。全球最专业的AI对抗生成模型分享网站civitai,每日都有众多模型设计师(C)在此免费分享自己所训练的模型供他人下载。 然而,即便知名如该网站,对模型设计师(C)分享的模型所使用的训练图片的合法授权问题未作严格要求。导致全球许多美术作品在未经原作者(B)授权的情况下,被批量用作训练材料,并转化为AI模型。 因此,尽管AI生图技术表面上呈现出繁荣的开源互利态势,实质上却成为无数原创插画作者痛心疾首的罪恶渊薮! (四) 观 点 的 探 讨 笔者认为,从前文中的北京互联网法院法院判决可见,主流观点着重于将AI生图技术理解为一种生产工具,图片生成者(D)使用该生产工具而创作的美术作品,应当得到保护,系对图片生成者(D)行为的肯定评价。就目前AI生图技术的开源态势下,除了有利于保护图片生成者(D)的权益之外,更刺激了开发者(A)对相关技术的推广和发展。 而非主流观点则更倾向于保护原作者(B)及模型训练师(C)的权益,分析如下: 保护模型设计师(C)权益 在未经模型设计师(C)授权的情况下,图片生成者(D)使用其制作的模型进行创作,并声称享有生成图片的著作权,系对模型设计师(C)权利的侵犯。 从前文对模型制作过程可知,模型设计师(C)若经原作者(B)的合法授权后,根据需求利用原作者的美术作品,并通过调整进行训练所得的模型,笔者认为系符合我国著作权法对“演绎作品”的定义。 因此,模型设计师(C)对其制作的AI模型拥有独立的著作权、使用权、署名权、保护作品完整权以及改编权等。任何人均必须在模型设计师(C)授权范围内使用该模型。 保护原作者(B)权益 如前所述,AI模型是以原作者(B)的美术作品为基础演绎而成,原作者(B)享有其作品的独立使用权、署名权、保护作品完整权、改编权以及其他相关权益。图片生成者(D)在使用由原作者的美术作品训练而成的AI模型创作的AI美术作品时,若未经原作者(B)授权许可,即构成对原作者(B)权益的侵犯。 除非原作者(B)、模型设计师(C)以及图片生成者(D)均是同一人,否则,图片生成者(D)利用演绎作品进行创作,实质上系一种再演绎行为,因此应当遵守“双重授权规则”。 除此之外,模型设计师(C)在训练AI模型时,也需要考虑到版权问题。因为AI模型的训练过程涉及对大量素材的整合和处理,如果这些素材中含有侵权内容,那么模型设计师(C)和图片生成者(D)都可能面临侵权的法律风险。因此,模型设计师(C)有责任确保AI模型的训练素材的合法性,并在未经授权的情况下,不得擅自使用原作者(B)作品进行训练。 (五) 未来AI生图纠纷的分支 笔者预测在未来不久的时间里,必然会出现此类案件:某知名插画家A发现网络上大量涌现与其风格相似的作品,而A从未创作过这些作品。经过调查,发现有人将A的作品制作成AI模型,从而导致了这一现象。为了维护自身权益,A将所有风格相似作品的发布者诉诸法庭。 再有甚者甚至会出现如下纠纷: 01. “图生图”纠纷 “图生图”技术是指通过AI算法将一幅图像生成另一幅具有相似风格或内容的图像。这种技术在艺术创作、设计等领域具有广泛的应用前景。然而,利用图生图技术生成的作品可能侵犯原作品的版权。争议的焦点在于,图生图技术生成的作品是否属于原创,以及是否应当受到著作权法的保护。 02. “ControlNet模型生图”纠纷 ControlNet模型是一种用于图像生成的AI技术,通过在现有图像上进行叠加生成新的图像。这种技术在很大程度上提高了图像生成的质量和效果。然而,在使用ControlNet模型进行图像生成时,也存在侵犯原作品版权的风险。 03. “局部涂鸦”纠纷 局部涂鸦是一种通过对现有图像进行局部修改生成新图像的技术。这种技术在设计、广告等领域具有广泛的应用。然而,局部涂鸦技术在带来便利的同时,也引发了版权纠纷。 04. “动作生图”纠纷 动作生图技术是指通过AI算法将一段动作生成另一段具有相似风格或内容的动作。这一技术在电影、游戏等领域具有广泛的应用。以《黑客帝国》曾买断演员功夫动作版权问题为例,争议的焦点在于,特定动作是否属于原创,以及是否应当受到著作权法的保护。 (六) 写 在 文 末 笔者对于两种观点的探讨,旨在激发思考,抛砖引玉,而非作出定论。 尽管AI生图技术为我们的生活和创作带来了诸多便利,但其潜在的知识产权纠纷亦不容忽视。为规避侵权风险,我们应在尊重和保护原作品著作权的基础上,适度运用AI技术进行图像创作。同时,相关部门也应加大对AI生图领域的法律法规建设力度,为其健康发展提供坚实保障。 在此背景下,作为法律工作者,我们有必要深入研究AI的整个生态原理,以正本清源。对未知的探索和对已知的深入学习,将有助于我们更好地应对AI带来的挑战。 受篇幅所限,本文仅对部分法律问题进行了探讨,期待后续补正。感谢您的关注和指正,期待与您共同交流。
/END/ 广东泽康律师事务所 陈康俊 |