摘要:生成式人工智能程序的快速发展使得著作权领域的侵权问题频发,判断程序是否侵权 应当结合“ 接触 + 实质性相似 ”规则,并判断其是否可以落入“ 合理使用 ”制度的保护范围。在 认定侵权问题后,还存在判断著作权侵权主体、归责原则以及责任承担等问题,生成式人工智能 程序是否能够成为法律意义上的主体是判断著作权侵权行为发生和解决的前提。鉴于人工智能程 序的飞速发展,相应的法律法规应当做出及时调整,将人工智能程序的前期“ 深度学习行为 ”纳 入“ 合理使用 ”制度的保护范围, 以维持著作权领域权利保护与技术发展间的双向平衡。
一、导言
ChatGPT 面世 2 个月内活跃用户的数量高达 1 亿,其一跃成为史上最火爆的算法运用之一 ,同 时这也被认为是目前出现的最新和最强大的人工智 能。[1]该程序的出现丰富了文化产业的繁荣景象 , 人们在惊叹 ChatGPT 带来的信息检索 、整合 、生 成的能力之外,其知识产权领域的质疑也随之而 来 ,具体而言是著作权的侵权问题:ChatGPT 模 型的形成和完善依赖大量的数据训练 ,而用于训 练的数据往往包含书籍 、论文 、散文等受著作权 法保护的内容。[2]生成式人工智能程序基于生成 模型的人工智能系统 ,可从给定的输入数据中生 成新的内容,如文本 、图像、音频等。与传统程序 相异 ,生成式人工智能程序通过学习大量的数据 自主生成新的信息 ,而无需明确的规则或预先定 义的模板 。即程序可以根据输入的文本或指令生 成连贯 、有逻辑的回复 。这种模型可以理解上下 文 ,并生成更加人类化的响应。①
另有其他生成式模型可以进行文本摘要 、翻 译和创作等任务 ,展现出更广泛的应用潜力。人 工智能对著作权法律制度的影响 ,既包括人工智 能生成内容的著作权保护问题 ,也包括人工智能 应用中对作品的使用以及前置地对作品数字化扫描行为的合法性问题。[3]生成式人工智能程序在 多个领域有广泛应用 。在自然语言处理领域 ,它 们可以用于机器翻译 、文本摘要 、对话系统等任 务 。在创作领域 ,它们可以用于自动生成故事 、 诗歌 、音乐等艺术作品 。由于生成式模型可以学 习和模仿大量的文本内容,其极有可能生成与原 创作品相似甚至相同的内容 ,这可能侵犯原创作 者的著作权 。例如 ,生成式人工智能程序可以创 建类似于已经存在的文章 、故事 、音乐或其他创 作作品的内容 ,而无需获得原作者的授权或支付 相应的版权费用 。即使生成式人工智能程序生成 的内容在某些情况下可能被认为是侵权行为 ,然 而 ,由于内容由算法生成 ,在判断是否其构成侵 权行为 、侵权行为主体如何认定的问题上还存在困难。

为此 ,有的国家和组织正积极研究并制定相 关的法律法规 ,以确保在生成式人工智能程序 应用中保护原创作者的权益。此外 ,技术和算法 的发展也可能促使生成式人工智能程序在生成 内容时更加注重尊重著作权和其他知识产权 。以 ChatGPT 为代表的生成式人工智能程序已大规模 投入市场。本文分别从生成式人工智能程序的开 发阶段 、市场阶段入手 ,分析不同阶段生成式人工智能程序可能存在的著作权侵权行为,并对学 习阶段的“ 合理使用 ”问题进行探讨 ,对输出阶 段的“ 接触 + 实质性相似 ”问题进行分析 。即使 学界已对人工智能程序是否具有法律人格进行了 明确的分析,传统观点认为在“ 弱人工智能时代 ” 人工智能程序不具有民事主体地位 ,也有学者提 出赋予人工智能程序“ 有限人格 ”地位等假设。[4] 建立在生成式人工智能程序已经可以生产出与人 类输出相似的内容的基础上 ,在分析责任分配及 责任承担之前 ,有必要对生成式人工智能程序的 责任主体地位进行重新讨论,并在确定人工智能 生成内容非作品 、无权利归属的前提下对生成内 容的责任主体的确定及责任承担进行分析。
二 、生成式人工智能程序著作权侵权的事实证成
ChatGPT 类生成式人工智能程序在数据的学 习开发阶段可能涉及的作品 ,大致可以分为已经 进入公有领域的作品和仍在保护期内的作品。对 公有领域作品的使用暂不做分析,那些仍处于保 护期内的作品可能会涉及著作权侵权的问题 ,因 ChatGPT 类程序在生成内容时,并不会在生成的 内容中标明内容来源。在著作权侵权认定司法实 践中 ,主要采用“ 接触+实质性相似 -合理使用 ” 规则。[5]
( 一 )生成式人工智能程序的著作权侵权认定
使用生成式人工智能程序生成内容可能侵犯 著作财产权和著作人身权。《 中华人民共和国著作 权法 》(以下简称《著作权法 》)第十条规定了著 作权人享有的人身权和财产权。假设一种情景: 某作者创作了一篇小说 ,ChatGPT 用户未经作者 许可,通过输入指令命令 ChatGPT 将该小说的内 容进行部分修改 ,并将作品的署名进行修改 ,后 又将内容公开进行传播或展示。在这种情况下 , ChatGPT 未经许可修改他人作品 ,侵犯了作者的 修改权、署名权,若对作品进行歪曲、篡改的,可 能还涉及侵犯保护作品完整权。
以复制权为例,若 ChatGPT 在前期的数据训 练阶段使用的作品未经著作权人的许可 ,在程序 学习过程中涉及对训练数据的复制、翻译、改编 、 汇编等行为 ,那么数据训练的过程便涉及复制 权的侵权。对是否侵犯著作权人复制权 ,因其涉 及“ 复制 ”与“ 临时复制 ”的问题 ,在此需要分 为 ChatGPT 的开发阶段和使用阶段两个过程来 分析 。在我国 ,对于“ 临时复制 ”行为一般不认 定为著作权的侵权 ,复制行为的发生应当以作品被相对稳定和持久地固定在有形物质载体之上 为基础 ,复制权控制的复制行为必须要求产生新 的复制件 ,如果仅以物理手段附着在新的载体之 上,没有导致复制件数量的增加,则不构成复制行 为 。因此,在 ChatGPT 的开发阶段 ,ChatGPT 在大 量深入学习文本与数据时仅涉及临时复制行为 , 并不涉及将受保护的作品制作为一份或者多份进 行传播 ,在这个过程中 ,ChatGPT 生成内容并不 会侵犯著作权人的复制权。判断 ChatGPT 对复制 权的侵权,还需要结合 ChatGPT 生成内容这一过 程和结果 。当 ChatGPT 生成相应内容后 ,此时可 以认定为 ChatGPT 未经他人许可使用了他人受保 护的作品 ,并已经生成了相似的内容 、产生了新 的复印件 ,使用人可以将其支配 ,公开传播将会 导致复制权的侵权。如果不同阶段对于作品的使 用行为在目标和效果层面一致 ,可以将其视作一 个整体给予统一定性。[6]也有观点认为 ,应当通 过分层分析而非统合分析的方法,从程序的开发 阶段和市场阶段分别进行分析。[7]综合来看 ,在 复制权的侵权问题上,应该将输入与输出统合进 行分析,输入阶段不侵犯复制权的认定不影响内 容输出后的侵权认定。假设一个 ChatGPT 用户使 用 ChatGPT 生成一段改编自某个作品的文本而未 经著作权人的许可和授权 ,ChatGPT 的使用者可 能通过生成的文本进行各种活动或发布于某个网 站,如创作小说、剧本、歌曲等,那么在此过程中 可能会侵犯到著作权人的改编权 、汇编权 、信息网络传播权。
( 二 )“接触+实质性相似 ”规则下的侵权 判定
生成式人工智能程序在数据输出阶段可能涉 及对物料的汇编、整合、改编 、翻译等行为,未经 著作权人许可或以其他非法途径获得的数据 ,可 能会造成著作权的侵权。判断一段表达是否侵犯了 著作权,要判断是否有“ 接触 ”作品的可能性,此 行为考察的是是否存在故意抄袭的可能性,[8] 即 侵权行为人是否具有主观上的侵权故意 、是否有 可能接触到侵权作品。但这里还存在著作领域的 “ 允许耦合 ”概念 ,即如果侵权行为人创造出了与 侵权客体相同的表达 ,那么各自受到保护 。由于 接触与否的事实主要由被控侵权人掌控 ,司法实 践中常以作品已经公开发表为由 ,推定“ 接触 ” 的存在 ,并由被控侵权人承担相反证明义务。[9] 在人工智能程序的内容输入阶段 ,程序必须以接 收大量已有数据为程序运行基础 。因此 ,显而易见的是程序一定接触了侵权文本。
相较于“ 接触 ”要件的认定,“实质性相似 ” 的判断更为复杂。在生成式人工智能程序的运行 情景中 ,使用是否构成“ 实质性相似 ”的传统 判断很难实现。判断“ 实质性相似 ”的方法主要 有:美国汉德法官于 1930 年在尼克斯案中提出的 “ 抽象分离法 ”① 、1970 年美国罗斯案中创立的 “ 整体观感法 ”② 以及 1977 年斯德和马迪科洛夫 特电视台诉麦当劳公司案中提出的“ 内外部测试 法 ”③。此类人工智能程序已可以将生成内容控制 在“ 非简单复制 ”的范围之外 ,简单的剽窃行为 容易判断 ,较难处置的是人工智能程序通过其自 身的程序设定将特定作品进行洗稿 、重新编排、全新输出 ,或使用同义替换的方式对作品中的遣 词造句进行重新编排和修改 ,或将作品中的“ 表 达 ”概括提炼为相应的“ 思想 ”, 再将“ 思想 ” 重新利用其他的表达方式进行呈现 。因此 ,传统 意义上的“ 实质性相似 ”的判断在生成式人工智 能程序运行上恐怕难以实现,具体的判断还要结 合已经发生的实际情况 —— 侵权人是否具有传 播 、获利行为 。在判断标准上 ,有观点还认为证 明其是否形成了市场替代,[10] 即运用是否对作者 的实际经济权利受到影响进行判断 。观点的理论 依据运用著作权的性质可以进行合理的解释 —— 知识产权是民事财产权 ,知识产权制度的目的为 激励创新 、增加社会财富 ,而行为人若侵犯了著 作权主体的财产利益,那么可以认定为行为人的 传播 、获益行为侵犯了著作权。
(三 )“ 合理使用 ”规则的适用限制
为平衡著作权人与社会公众的利益,《保护文 学和艺术作品伯尔尼公约 》(以下简称《伯尔尼 公约 》)规定了合理使用制度的“ 三步检验法 ”, 我国《著作权法 》2020 年第三次修正时将此明确 纳入 。根据《伯尔尼公约 》的规定,“ 三步检验 法 ”是指:本同盟成员国法律得允许在某些特殊 情况下复制上述作品 ,只要这种复制不损害作品 的正常使用也不致无故侵害作者的合法利益。④
《美国版权法 》第一百零七条规定的判断合理使 用“ 四要素 ”,分别从使用的目的和性质 ,包括 该使用是出于商业目的还是非营利的教育目的 、 受版权保护的作品的性质 、与整个受版权保护作 品相比所使用部分的数量和质量 、使用对版权作 品潜在市场或价值的影响四要素进行判断。⑤我国 《 著作权法 》第二十四条规定的合理使用的条件 为,应当指明作者姓名或者名称、作品名称,并且 不得影响该作品的正常使用 ,也不得不合理地损 害著作权人的合法权益,并对具体情形进行了明 确列举。⑥ 目前,我国《著作权法 》第二十四条列 举了属于合理使用的几种情况 ,2020 年第三次修 正时在第二十四条末款增加“ 法律 、行政法规规 定的其他情形 ”,这种半封闭式的立法模式未将 “AI 学习 、创作中的使用 ”明确在内。
未经授权许可的“AI 的学习和创作 ”看似难 以满足《伯尔尼公约 》第九条第二款“ 三步检验 法 ”的规定。⑦ 首先,《伯尔尼公约 》要求对作品 的使用要建立在“ 某些特殊情况下 ”。“ 特殊 ”二 字表明适用的前提 、条件严苛且适用情形较少 , 而生成式人工智能程序前期的深度学习建立在海 量的数据吸收下 ,和“ 三步检验法 ”规定的“ 特 殊 ”情形恰好相反。其次 ,关于“ 不损害作品的 正常使用 ”,要求在程序的学习阶段对数据的利 用方式为简单的数据输入 ,不存在对作品的歪 曲 、篡改 ,如此来看此过程并不违反第二步的规 定。最后,再看“ 不得损害作者的合法权益 ”,根 据《伯尔尼公约 》的规定,作品的作者依法享有复 制 、向公众传播 、改编等权利 。经人工智能程序 利用,无论此行为在著作权法上作“ 复制 ”还是 “ 临时复制 ”的定性 ,即使未到内容的输出和应用 阶段,那么在输出阶段之前的预备工作中都难以 保证作者享有的著作人身权和财产权不受侵害 。 在《伯尔尼公约 》的规制下 ,未经作者授权即使 用权利人作品并应用于 AI 的学习和创作的行为 难以认定为是“ 合理使用 ”,属于著作权领域的 侵权行为 。而依据美国的“ 四要素 ”要件 ,首先要关注的是其使用的性质和目的是否属于商业行 为,但大多数生成式人工智能程序都无法满足。
目前面世的类似程序有 Facebook 的 BlenderBot、Google 的 Meena 、百度公司的“ 文心一言 ”程序 等 ,大多为商业化目的的程序 。为保证证成的完 整性,假设存在非商业性的程序,那么“ 四要素 ” 规定的“ 数量 ”问题也难以成功 —— 数量要求限 制在较小的范围内,而 AI 程序的海量数据与此刚好相反。
不论作品的学习或输出阶段 ,ChatGPT 是商 业化利用的过程,从合理使用的角度看无法满足 要求 。在我国 ,无论是业界还是学界 ,均认为合 理使用制度内含非商业性使用之构成要件。[11]有 观点将是否“ 用于商业用途 ”作为判断是否属于 合理使用的标准。但从我国《著作权法 》规定的 合理使用的要素来看,其中“ 不得不合理地损害 著作权人的合法权益 ”中的“ 合法权益 ”可以涵 盖权利人的财产权利 。因此 ,这个观点将程序的 使用分为非商业目的与商业目的两种分类方式 , 认为非商业目的的使用可以归为“ 合理使用 ”的 要件。[12]笔者认为此种观点不妥。综上所述 ,在 未经著作权人允许的前提下,依照目前的法律规 定 ,无论是在开发阶段还是投入市场后 ,或统一 对这个环节进行评价,对作品的使用都无法纳入 《 著作权法 》“ 合理使用 ”的保护中 ,生成式人 工智能程序的著作权侵权问题亟须规制 。但对 于“ 合理使用 ”是否可以应用于 AI 程序 ,日本、 欧盟都已经通过立法和实践做出了不同回应和准 备。① 合理使用与著作权保护一直是为实现社会利 益和个人权利动态平衡需要考虑的稳定因素 ,二 者的关系和内容一直伴随社会发展以及新情况的 产生而发生改变 ,鉴于生成式人工智能程序的发 展速度 ,有必要重新在此问题上进行讨论 ,考虑 是否将人工智能程序的学习阶段纳入合理使用的范畴内。

三 、著作权侵权责任承担判断前提分析及规 制路径
通过分析 ChatGPT 的运行机理 ,可以明确 ChatGPT 不论在研发阶段 、市场阶段 ,未经著作 权人允许 、使用他人作品并未落入“ 合理使用 ” 的保护下的行为面临著作权的侵权。在讨论侵权 责任承担的主体以及归责原则之前,需要明确的 是生成式人工智能程序的法律主体资格。
( 一 )判断前提:生成式人工智能程序是否具有法律主体资格
ChatGPT 类人工智能程序是否具有承担民事 责任的能力或人工智能程序背后的研发者以及人 工智能程序的使用者应当承担责任 ,或这些多主 体共同承担责任 ,这些问题亟须得到解决。分析 人工智能程序的侵权责任的承担 ,首先要在人工 智能程序的法律人格认定的基础上进行辨别。深 入解析人工智能程序是否具有法律人格 、具备何 种法律人格 ,才可以进一步解决侵权的责任承担 问题 。在人工智能兴起的初级阶段 ,陆续有学者 在此问题上已经得出明确的结论。1992 年 ,劳伦 斯·索伦就已对人工智能的法律人格问题的可行 性进行了讨论,他认为在早期人工智能时代可以 使用保守的方式处理,但人工智能真正普及后对 此问题要进行认真考虑。[13] 而以 ChatGPT 为代 表的生成式人工智能程序在市面已被大面积商 业使用,若赋予生成式人工智能程序以法律人格 , 或考虑赋予限制性的法律人格即首先让其具备 承担责任能力是值得考虑的 。于 ChatGPT 的生 产者而言,是对其责任规避的一种直接措施,对于 ChatGPT 的使用者而言 ,摆脱在模糊不清是否侵 权时的责任承担,对于 ChatGPT 的受害者而言 , 是能让其受到侵权损害赔偿的最快速方法 ,不至 于在侵权行为发生时 ,由于制度上的空缺而导致 法官分配责任时无法可依 ,陷入僵局 。在考虑到 以上解决问题的优势前提下,对生成式人工智能 程序能否由于其更新的能力而赋予其人格权利进行思考。
将人工智能程序根据智能能力的强弱大致 可以分为“ 弱人工智能程序 ”和“ 强人工智能程 序 ”。其中,“ 强人工智能程序 ”下的机器具有较 强的自主意识 ,是指能够依照自身的经验 、自主 创造能力进行有意识的创作 。在这种环境下 ,程 序的自主创造活动皆脱离于人类的想法和控制自 主生成 ,程序的研发者以及使用者无法预测其生 成的内容 。在此情况下 ,人工智能程序应当独立 承担民事责任。但依照目前的法律规定 ,人工智 能程序仍无法成为法律责任的主体 ,不具有法律 人格 。就目前人工智能程序的发展来看 ,生成式 的聊天工具还不具备较强的自主性,仍属于“ 弱 人工智能 ”。此时其为不具备自主意识的工具性 程序,人类仍为使用生成式人工智能程序的主导主体 ,生成式人工智能程序仅为辅助生成客户需 要的载体。
有学者曾对人工智能的法律地位与责任承担 能力进行猜想和大胆假设 ,其认为“ 理性 ”的智 能机器人应当被认定具有民事责任能力,但该观 点也是以智能机器人具有独立财产为基础的。[14] 然而,从目前情况来看 ,赋予人工智能程序独立 的财产存在实践上的困难。有学者提出了为人工 智能程序搭建潜在资金池 、建立强制保险制度的 方法,[15]通过投资的方式赋予人工智能程序一定 的财产使其具备承担责任的能力。还有观点认为 可以仿照公司法人的做法 ,赋予人工智能主体以 独立的法律地位,但公司法人设立的前提是公司 是由自然人组成的实体 ,与人工智能程序不同 。 无法对生成式人工智能程序赋予独立的拥有独立 财产能力,意味着其无法承担民事责任 。因此,人 工智能程序本身不应认定为人工智能生成物的侵 权主体。
综上 ,不论生成式人工智能程序目前可以进 行弱效或强效的反应,其目前仍然没有独立与自 主形成的意识 、赋予其独立财产的假设目前无 法实现具体实施 、不具备可以独立承担责任的能 力 ,即并不具备成为法律主体资格的条件 。即使 目前欧盟等地区加速步伐推动人工智能方面法案 的通过,仍然不会将人工智能程序作为承担法律 民事责任的主体,我国亦然。按此思路,应当从现 有的法律规范中解决人工智能程序侵权的途径。
( 二 )规制路径:已有规则下的调整路径
尽管生成式人工智能程序具有强大的创造性 和应用潜力,但仍面临挑战:生成内容的准确性 、 对话的连贯性、伦理和法律问题 。因此,对生成式 人工智能程序的研究和应用需要综合考虑技术 、 伦理和法律等多方面的因素。许多国家已对人工 智能程序在作品上的使用做出让步 ,2023 年 7 月, 国家网信办联合国家发展改革委 、教育部 、科技 部 、工业和信息化部 、公安部 、广电总局七部门 也联合印发了《生成式人工智能服务管理暂行办 法 》,但对于程序前期学习阶段是否属于“ 合理 使用 ”制度的范畴未作出规定 。随着科学技术的 进一步发展,建议将人工智能程序的学习阶段纳 入“ 合理使用 ”的范畴 ,扩大“ 合理使用 ”的解 释范围 ,将《著作权法 》第二十四条增加“ 其他 可以认定为合理使用的行为 ”或“ 人工智能机器 学习使用 ”的类似表述。
四 、结语
目前,ChatGPT 离“ 强人工智能 ”的水平还有 很大差距,但鉴于人工智能程序的飞速发展 ,对 “ 强人工智能 ”时代的法律规制也应当提前进行 考虑。对未来的“ 超人工智能机器 ”是否能成为 著作权法上的权利人 ,还需要将此问题放入民法 的体系内进行仔细探讨。建立新的智能社会 ,生 成式人工智能带来的变革给人类带来了极大的便 利 ,提高了创造能力 ,人们不能仅享受智能社会 带来的利好 ,而对其可能会造成的侵权后果视而 不见。应考虑改变传统人工智能程序不视为法律 人格或无法承担侵权责任的范式 ,回顾“ 公司法 人 ”“视为作者 ”制度出现的艰难历史 ,在兼顾 法律与道德的基础上重新审视非生物的法律主体 地位,将人工智能程序的学习行为纳入“ 合理使 用 ”的范畴内 ,推动科技发展与著作权法保护的 双向平衡。
参考文献
[1] 邓建国.概率与反馈:ChatGPT 的智能原理与人机 内容共创[J].南京社会科学 ,2023(3):86-94,142 .
[2] 郭春镇.生成式 AI 的融贯性法律治理—— 以生成 式预训练模型(GPT)为例[J].现代法学 ,2023,45 (3):88-107 .
[3] 司晓 ,曹建峰.欧盟版权法改革中的大数据与人工 智能问题研究[J].西北工业大学学报(社会科学 版),2019(3):95-102,3 .
[4] 袁曾.人工智能有限法律人格审视[J].东方法学 , 2017(5):50-57 .
[5] 官正艳.论司法实践中洗稿侵犯著作权的认定标准 [J].电子知识产权 ,2018(11):78-83 .
[6] 蒋珂.论合理使用中的“行为”——兼评谷歌图书案 [J].法学评论 ,2015,33(6):185-193 .
[7] 初萌.人工智能对版权侵权责任制度的挑战及应对 [J].北方法学 ,2021,15(1):138-150 .
[8] 熊琦 .“接触 + 实质性相似”是版权侵权认定的“神 器”吗 ?[N].中国知识产权报 ,2017-07-14(10).
[9] 初萌.人工智能对版权侵权责任制度的挑战及应对 [J].北方法学 ,2021,15(1):138-150 .
[10] 曾田.人工智能创作的版权侵权问题研究[J].河北 法学 ,2019,37(10):176-189 .
[11] 冯晓青 ,胡梦云.合理使用视野下“私人复制”著作 权问题研究[J].南都学坛 ,2011,31(6):78-86 .
[12] 刘友华 ,魏远山.机器学习的著作权侵权问题及其 解决[J].华东政法大学学报 ,2019,22(2):68-79 .
[13] Lawrence B.Solum.Legal Personhood for Artificial Intelligences[J].North Carolina Law Review,1992 (70):1231 .
[14] 叶明 ,朱静洁.理性本位视野下智能机器人民事法 律地位的认定[J].河北法学 ,2019,37(6):10-21 .
[15] 周书环.聊天机器人的法律人格争议与传播侵权责 任研究:基于 ChatGPT 场景视角[J].南京社会科 学 ,2023(6):90-99 .
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
第一种意见认为,刘某的行为构成贪污罪。全国... 详细>>
如何设计有效的环境治理政策, 是学术界和政策... 详细>>
