当前位置：首页 > 法律论文 > 正文

生成式人工智能程序的著作权侵权问题及规制路径论文

发布时间：2024-03-29 13:37:46 文章来源：SCI论文网我要评论

SCI论文（www.lunwensci.com）

　　摘要：生成式人工智能程序的快速发展使得著作权领域的侵权问题频发，判断程序是否侵权应当结合“ 接触 + 实质性相似 ”规则，并判断其是否可以落入“ 合理使用 ”制度的保护范围。在认定侵权问题后，还存在判断著作权侵权主体、归责原则以及责任承担等问题，生成式人工智能程序是否能够成为法律意义上的主体是判断著作权侵权行为发生和解决的前提。鉴于人工智能程序的飞速发展，相应的法律法规应当做出及时调整，将人工智能程序的前期“ 深度学习行为 ”纳入“ 合理使用 ”制度的保护范围，以维持著作权领域权利保护与技术发展间的双向平衡。

　　一、导言

　　ChatGPT 面世 2 个月内活跃用户的数量高达 1 亿，其一跃成为史上最火爆的算法运用之一，同时这也被认为是目前出现的最新和最强大的人工智能。[1]该程序的出现丰富了文化产业的繁荣景象，人们在惊叹 ChatGPT 带来的信息检索、整合、生成的能力之外，其知识产权领域的质疑也随之而来，具体而言是著作权的侵权问题：ChatGPT 模型的形成和完善依赖大量的数据训练，而用于训练的数据往往包含书籍、论文、散文等受著作权法保护的内容。[2]生成式人工智能程序基于生成模型的人工智能系统，可从给定的输入数据中生成新的内容，如文本、图像、音频等。与传统程序相异，生成式人工智能程序通过学习大量的数据自主生成新的信息，而无需明确的规则或预先定义的模板。即程序可以根据输入的文本或指令生成连贯、有逻辑的回复。这种模型可以理解上下文，并生成更加人类化的响应。①

　　另有其他生成式模型可以进行文本摘要、翻译和创作等任务，展现出更广泛的应用潜力。人工智能对著作权法律制度的影响，既包括人工智能生成内容的著作权保护问题，也包括人工智能应用中对作品的使用以及前置地对作品数字化扫描行为的合法性问题。[3]生成式人工智能程序在多个领域有广泛应用。在自然语言处理领域，它们可以用于机器翻译、文本摘要、对话系统等任务。在创作领域，它们可以用于自动生成故事、诗歌、音乐等艺术作品。由于生成式模型可以学习和模仿大量的文本内容，其极有可能生成与原创作品相似甚至相同的内容，这可能侵犯原创作者的著作权。例如，生成式人工智能程序可以创建类似于已经存在的文章、故事、音乐或其他创作作品的内容，而无需获得原作者的授权或支付相应的版权费用。即使生成式人工智能程序生成的内容在某些情况下可能被认为是侵权行为，然而，由于内容由算法生成，在判断是否其构成侵权行为、侵权行为主体如何认定的问题上还存在困难。

　　为此，有的国家和组织正积极研究并制定相关的法律法规，以确保在生成式人工智能程序应用中保护原创作者的权益。此外，技术和算法的发展也可能促使生成式人工智能程序在生成内容时更加注重尊重著作权和其他知识产权。以 ChatGPT 为代表的生成式人工智能程序已大规模投入市场。本文分别从生成式人工智能程序的开发阶段、市场阶段入手，分析不同阶段生成式人工智能程序可能存在的著作权侵权行为，并对学习阶段的“ 合理使用 ”问题进行探讨，对输出阶段的“ 接触 + 实质性相似 ”问题进行分析。即使学界已对人工智能程序是否具有法律人格进行了明确的分析，传统观点认为在“ 弱人工智能时代 ” 人工智能程序不具有民事主体地位，也有学者提出赋予人工智能程序“ 有限人格 ”地位等假设。[4] 建立在生成式人工智能程序已经可以生产出与人类输出相似的内容的基础上，在分析责任分配及责任承担之前，有必要对生成式人工智能程序的责任主体地位进行重新讨论，并在确定人工智能生成内容非作品、无权利归属的前提下对生成内容的责任主体的确定及责任承担进行分析。

　　二、生成式人工智能程序著作权侵权的事实证成

　　ChatGPT 类生成式人工智能程序在数据的学习开发阶段可能涉及的作品，大致可以分为已经进入公有领域的作品和仍在保护期内的作品。对公有领域作品的使用暂不做分析，那些仍处于保护期内的作品可能会涉及著作权侵权的问题，因 ChatGPT 类程序在生成内容时，并不会在生成的内容中标明内容来源。在著作权侵权认定司法实践中，主要采用“ 接触+实质性相似 -合理使用 ” 规则。[5]

　　( 一 )生成式人工智能程序的著作权侵权认定

　　使用生成式人工智能程序生成内容可能侵犯著作财产权和著作人身权。《中华人民共和国著作权法》(以下简称《著作权法》)第十条规定了著作权人享有的人身权和财产权。假设一种情景：某作者创作了一篇小说，ChatGPT 用户未经作者许可，通过输入指令命令 ChatGPT 将该小说的内容进行部分修改，并将作品的署名进行修改，后又将内容公开进行传播或展示。在这种情况下， ChatGPT 未经许可修改他人作品，侵犯了作者的修改权、署名权，若对作品进行歪曲、篡改的，可能还涉及侵犯保护作品完整权。

　　以复制权为例，若 ChatGPT 在前期的数据训练阶段使用的作品未经著作权人的许可，在程序学习过程中涉及对训练数据的复制、翻译、改编、汇编等行为，那么数据训练的过程便涉及复制权的侵权。对是否侵犯著作权人复制权，因其涉及“ 复制 ”与“ 临时复制 ”的问题，在此需要分为 ChatGPT 的开发阶段和使用阶段两个过程来分析。在我国，对于“ 临时复制 ”行为一般不认定为著作权的侵权，复制行为的发生应当以作品被相对稳定和持久地固定在有形物质载体之上为基础，复制权控制的复制行为必须要求产生新的复制件，如果仅以物理手段附着在新的载体之上，没有导致复制件数量的增加，则不构成复制行为。因此，在 ChatGPT 的开发阶段，ChatGPT 在大量深入学习文本与数据时仅涉及临时复制行为，并不涉及将受保护的作品制作为一份或者多份进行传播，在这个过程中，ChatGPT 生成内容并不会侵犯著作权人的复制权。判断 ChatGPT 对复制权的侵权，还需要结合 ChatGPT 生成内容这一过程和结果。当 ChatGPT 生成相应内容后，此时可以认定为 ChatGPT 未经他人许可使用了他人受保护的作品，并已经生成了相似的内容、产生了新的复印件，使用人可以将其支配，公开传播将会导致复制权的侵权。如果不同阶段对于作品的使用行为在目标和效果层面一致，可以将其视作一个整体给予统一定性。[6]也有观点认为，应当通过分层分析而非统合分析的方法，从程序的开发阶段和市场阶段分别进行分析。[7]综合来看，在复制权的侵权问题上，应该将输入与输出统合进行分析，输入阶段不侵犯复制权的认定不影响内容输出后的侵权认定。假设一个 ChatGPT 用户使用 ChatGPT 生成一段改编自某个作品的文本而未经著作权人的许可和授权，ChatGPT 的使用者可能通过生成的文本进行各种活动或发布于某个网站，如创作小说、剧本、歌曲等，那么在此过程中可能会侵犯到著作权人的改编权、汇编权、信息网络传播权。

　　( 二 )“接触+实质性相似 ”规则下的侵权判定

　　生成式人工智能程序在数据输出阶段可能涉及对物料的汇编、整合、改编、翻译等行为，未经著作权人许可或以其他非法途径获得的数据，可能会造成著作权的侵权。判断一段表达是否侵犯了著作权，要判断是否有“ 接触 ”作品的可能性，此行为考察的是是否存在故意抄袭的可能性，[8] 即侵权行为人是否具有主观上的侵权故意、是否有可能接触到侵权作品。但这里还存在著作领域的 “ 允许耦合 ”概念，即如果侵权行为人创造出了与侵权客体相同的表达，那么各自受到保护。由于接触与否的事实主要由被控侵权人掌控，司法实践中常以作品已经公开发表为由，推定“ 接触 ” 的存在，并由被控侵权人承担相反证明义务。[9] 在人工智能程序的内容输入阶段，程序必须以接收大量已有数据为程序运行基础。因此，显而易见的是程序一定接触了侵权文本。

　　相较于“ 接触 ”要件的认定，“实质性相似 ” 的判断更为复杂。在生成式人工智能程序的运行情景中，使用是否构成“ 实质性相似 ”的传统判断很难实现。判断“ 实质性相似 ”的方法主要有：美国汉德法官于 1930 年在尼克斯案中提出的 “ 抽象分离法 ”① 、1970 年美国罗斯案中创立的 “ 整体观感法 ”② 以及 1977 年斯德和马迪科洛夫特电视台诉麦当劳公司案中提出的“ 内外部测试法 ”③。此类人工智能程序已可以将生成内容控制在“ 非简单复制 ”的范围之外，简单的剽窃行为容易判断，较难处置的是人工智能程序通过其自身的程序设定将特定作品进行洗稿、重新编排、全新输出，或使用同义替换的方式对作品中的遣词造句进行重新编排和修改，或将作品中的“ 表达 ”概括提炼为相应的“ 思想 ”，再将“ 思想 ” 重新利用其他的表达方式进行呈现。因此，传统意义上的“ 实质性相似 ”的判断在生成式人工智能程序运行上恐怕难以实现，具体的判断还要结合已经发生的实际情况 —— 侵权人是否具有传播、获利行为。在判断标准上，有观点还认为证明其是否形成了市场替代，[10] 即运用是否对作者的实际经济权利受到影响进行判断。观点的理论依据运用著作权的性质可以进行合理的解释 —— 知识产权是民事财产权，知识产权制度的目的为激励创新、增加社会财富，而行为人若侵犯了著作权主体的财产利益，那么可以认定为行为人的传播、获益行为侵犯了著作权。

　　(三 )“ 合理使用 ”规则的适用限制

　　为平衡著作权人与社会公众的利益，《保护文学和艺术作品伯尔尼公约》(以下简称《伯尔尼公约》)规定了合理使用制度的“ 三步检验法 ”，我国《著作权法》2020 年第三次修正时将此明确纳入。根据《伯尔尼公约》的规定，“ 三步检验法 ”是指：本同盟成员国法律得允许在某些特殊情况下复制上述作品，只要这种复制不损害作品的正常使用也不致无故侵害作者的合法利益。④

　　《美国版权法》第一百零七条规定的判断合理使用“ 四要素 ”，分别从使用的目的和性质，包括该使用是出于商业目的还是非营利的教育目的、受版权保护的作品的性质、与整个受版权保护作品相比所使用部分的数量和质量、使用对版权作品潜在市场或价值的影响四要素进行判断。⑤我国《著作权法》第二十四条规定的合理使用的条件为，应当指明作者姓名或者名称、作品名称，并且不得影响该作品的正常使用，也不得不合理地损害著作权人的合法权益，并对具体情形进行了明确列举。⑥ 目前，我国《著作权法》第二十四条列举了属于合理使用的几种情况，2020 年第三次修正时在第二十四条末款增加“ 法律、行政法规规定的其他情形 ”，这种半封闭式的立法模式未将 “AI 学习、创作中的使用 ”明确在内。

　　未经授权许可的“AI 的学习和创作 ”看似难以满足《伯尔尼公约》第九条第二款“ 三步检验法 ”的规定。⑦ 首先，《伯尔尼公约》要求对作品的使用要建立在“ 某些特殊情况下 ”。“ 特殊 ”二字表明适用的前提、条件严苛且适用情形较少，而生成式人工智能程序前期的深度学习建立在海量的数据吸收下，和“ 三步检验法 ”规定的“ 特殊 ”情形恰好相反。其次，关于“ 不损害作品的正常使用 ”，要求在程序的学习阶段对数据的利用方式为简单的数据输入，不存在对作品的歪曲、篡改，如此来看此过程并不违反第二步的规定。最后，再看“ 不得损害作者的合法权益 ”，根据《伯尔尼公约》的规定，作品的作者依法享有复制、向公众传播、改编等权利。经人工智能程序利用，无论此行为在著作权法上作“ 复制 ”还是 “ 临时复制 ”的定性，即使未到内容的输出和应用阶段，那么在输出阶段之前的预备工作中都难以保证作者享有的著作人身权和财产权不受侵害。在《伯尔尼公约》的规制下，未经作者授权即使用权利人作品并应用于 AI 的学习和创作的行为难以认定为是“ 合理使用 ”，属于著作权领域的侵权行为。而依据美国的“ 四要素 ”要件，首先要关注的是其使用的性质和目的是否属于商业行为，但大多数生成式人工智能程序都无法满足。

　　目前面世的类似程序有 Facebook 的 BlenderBot、Google 的 Meena 、百度公司的“ 文心一言 ”程序等，大多为商业化目的的程序。为保证证成的完整性，假设存在非商业性的程序，那么“ 四要素 ” 规定的“ 数量 ”问题也难以成功 —— 数量要求限制在较小的范围内，而 AI 程序的海量数据与此刚好相反。

　　不论作品的学习或输出阶段，ChatGPT 是商业化利用的过程，从合理使用的角度看无法满足要求。在我国，无论是业界还是学界，均认为合理使用制度内含非商业性使用之构成要件。[11]有观点将是否“ 用于商业用途 ”作为判断是否属于合理使用的标准。但从我国《著作权法》规定的合理使用的要素来看，其中“ 不得不合理地损害著作权人的合法权益 ”中的“ 合法权益 ”可以涵盖权利人的财产权利。因此，这个观点将程序的使用分为非商业目的与商业目的两种分类方式，认为非商业目的的使用可以归为“ 合理使用 ”的要件。[12]笔者认为此种观点不妥。综上所述，在未经著作权人允许的前提下，依照目前的法律规定，无论是在开发阶段还是投入市场后，或统一对这个环节进行评价，对作品的使用都无法纳入《著作权法》“ 合理使用 ”的保护中，生成式人工智能程序的著作权侵权问题亟须规制。但对于“ 合理使用 ”是否可以应用于 AI 程序，日本、欧盟都已经通过立法和实践做出了不同回应和准备。① 合理使用与著作权保护一直是为实现社会利益和个人权利动态平衡需要考虑的稳定因素，二者的关系和内容一直伴随社会发展以及新情况的产生而发生改变，鉴于生成式人工智能程序的发展速度，有必要重新在此问题上进行讨论，考虑是否将人工智能程序的学习阶段纳入合理使用的范畴内。

　　三、著作权侵权责任承担判断前提分析及规制路径

　　通过分析 ChatGPT 的运行机理，可以明确 ChatGPT 不论在研发阶段、市场阶段，未经著作权人允许、使用他人作品并未落入“ 合理使用 ” 的保护下的行为面临著作权的侵权。在讨论侵权责任承担的主体以及归责原则之前，需要明确的是生成式人工智能程序的法律主体资格。

　　( 一 )判断前提：生成式人工智能程序是否具有法律主体资格

　　ChatGPT 类人工智能程序是否具有承担民事责任的能力或人工智能程序背后的研发者以及人工智能程序的使用者应当承担责任，或这些多主体共同承担责任，这些问题亟须得到解决。分析人工智能程序的侵权责任的承担，首先要在人工智能程序的法律人格认定的基础上进行辨别。深入解析人工智能程序是否具有法律人格、具备何种法律人格，才可以进一步解决侵权的责任承担问题。在人工智能兴起的初级阶段，陆续有学者在此问题上已经得出明确的结论。1992 年，劳伦斯·索伦就已对人工智能的法律人格问题的可行性进行了讨论，他认为在早期人工智能时代可以使用保守的方式处理，但人工智能真正普及后对此问题要进行认真考虑。[13] 而以 ChatGPT 为代表的生成式人工智能程序在市面已被大面积商业使用，若赋予生成式人工智能程序以法律人格，或考虑赋予限制性的法律人格即首先让其具备承担责任能力是值得考虑的。于 ChatGPT 的生产者而言，是对其责任规避的一种直接措施，对于 ChatGPT 的使用者而言，摆脱在模糊不清是否侵权时的责任承担，对于 ChatGPT 的受害者而言，是能让其受到侵权损害赔偿的最快速方法，不至于在侵权行为发生时，由于制度上的空缺而导致法官分配责任时无法可依，陷入僵局。在考虑到以上解决问题的优势前提下，对生成式人工智能程序能否由于其更新的能力而赋予其人格权利进行思考。

　　将人工智能程序根据智能能力的强弱大致可以分为“ 弱人工智能程序 ”和“ 强人工智能程序 ”。其中，“ 强人工智能程序 ”下的机器具有较强的自主意识，是指能够依照自身的经验、自主创造能力进行有意识的创作。在这种环境下，程序的自主创造活动皆脱离于人类的想法和控制自主生成，程序的研发者以及使用者无法预测其生成的内容。在此情况下，人工智能程序应当独立承担民事责任。但依照目前的法律规定，人工智能程序仍无法成为法律责任的主体，不具有法律人格。就目前人工智能程序的发展来看，生成式的聊天工具还不具备较强的自主性，仍属于“ 弱人工智能 ”。此时其为不具备自主意识的工具性程序，人类仍为使用生成式人工智能程序的主导主体，生成式人工智能程序仅为辅助生成客户需要的载体。

　　有学者曾对人工智能的法律地位与责任承担能力进行猜想和大胆假设，其认为“ 理性 ”的智能机器人应当被认定具有民事责任能力，但该观点也是以智能机器人具有独立财产为基础的。[14] 然而，从目前情况来看，赋予人工智能程序独立的财产存在实践上的困难。有学者提出了为人工智能程序搭建潜在资金池、建立强制保险制度的方法，[15]通过投资的方式赋予人工智能程序一定的财产使其具备承担责任的能力。还有观点认为可以仿照公司法人的做法，赋予人工智能主体以独立的法律地位，但公司法人设立的前提是公司是由自然人组成的实体，与人工智能程序不同。无法对生成式人工智能程序赋予独立的拥有独立财产能力，意味着其无法承担民事责任。因此，人工智能程序本身不应认定为人工智能生成物的侵权主体。

　　综上，不论生成式人工智能程序目前可以进行弱效或强效的反应，其目前仍然没有独立与自主形成的意识、赋予其独立财产的假设目前无法实现具体实施、不具备可以独立承担责任的能力，即并不具备成为法律主体资格的条件。即使目前欧盟等地区加速步伐推动人工智能方面法案的通过，仍然不会将人工智能程序作为承担法律民事责任的主体，我国亦然。按此思路，应当从现有的法律规范中解决人工智能程序侵权的途径。

　　( 二 )规制路径：已有规则下的调整路径

　　尽管生成式人工智能程序具有强大的创造性和应用潜力，但仍面临挑战：生成内容的准确性、对话的连贯性、伦理和法律问题。因此，对生成式人工智能程序的研究和应用需要综合考虑技术、伦理和法律等多方面的因素。许多国家已对人工智能程序在作品上的使用做出让步，2023 年 7 月，国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局七部门也联合印发了《生成式人工智能服务管理暂行办法》，但对于程序前期学习阶段是否属于“ 合理使用 ”制度的范畴未作出规定。随着科学技术的进一步发展，建议将人工智能程序的学习阶段纳入“ 合理使用 ”的范畴，扩大“ 合理使用 ”的解释范围，将《著作权法》第二十四条增加“ 其他可以认定为合理使用的行为 ”或“ 人工智能机器学习使用 ”的类似表述。

　　四、结语

　　目前，ChatGPT 离“ 强人工智能 ”的水平还有很大差距，但鉴于人工智能程序的飞速发展，对 “ 强人工智能 ”时代的法律规制也应当提前进行考虑。对未来的“ 超人工智能机器 ”是否能成为著作权法上的权利人，还需要将此问题放入民法的体系内进行仔细探讨。建立新的智能社会，生成式人工智能带来的变革给人类带来了极大的便利，提高了创造能力，人们不能仅享受智能社会带来的利好，而对其可能会造成的侵权后果视而不见。应考虑改变传统人工智能程序不视为法律人格或无法承担侵权责任的范式，回顾“ 公司法人 ”“视为作者 ”制度出现的艰难历史，在兼顾法律与道德的基础上重新审视非生物的法律主体地位，将人工智能程序的学习行为纳入“ 合理使用 ”的范畴内，推动科技发展与著作权法保护的双向平衡。

　　参考文献

        ［1］邓建国．概率与反馈：ChatGPT 的智能原理与人机内容共创［J］．南京社会科学，2023（3）：86-94，142 .
        ［2］郭春镇．生成式 AI 的融贯性法律治理—— 以生成式预训练模型（GPT）为例［J］．现代法学，2023，45 （3）：88-107 .
        ［3］  司晓，曹建峰．欧盟版权法改革中的大数据与人工智能问题研究［J］．西北工业大学学报（社会科学版），2019（3）：95-102，3 .
        ［4］袁曾．人工智能有限法律人格审视［J］．东方法学， 2017（5）：50-57 .
        ［5］官正艳．论司法实践中洗稿侵犯著作权的认定标准［J］．电子知识产权，2018（11）：78-83 .
        ［6］蒋珂．论合理使用中的“行为”——兼评谷歌图书案［J］．法学评论，2015，33（6）：185-193 .
        ［7］初萌．人工智能对版权侵权责任制度的挑战及应对［J］．北方法学，2021，15（1）：138-150 .
        ［8］  熊琦．“接触 + 实质性相似”是版权侵权认定的“神器”吗 ?［N］．中国知识产权报，2017-07-14（10）.
        ［9］初萌．人工智能对版权侵权责任制度的挑战及应对［J］．北方法学，2021，15（1）：138-150 .
        ［10］曾田．人工智能创作的版权侵权问题研究［J］．河北法学，2019，37（10）：176-189 .
        ［11］冯晓青，胡梦云．合理使用视野下“私人复制”著作权问题研究［J］．南都学坛，2011，31（6）：78-86 .
        ［12］刘友华，魏远山．机器学习的著作权侵权问题及其解决［J］．华东政法大学学报，2019，22（2）：68-79 .
        ［13］ Lawrence B．Solum．Legal Personhood for Artiﬁcial Intelligences［J］．North Carolina Law Review，1992 （70）：1231 .
        ［14］叶明，朱静洁．理性本位视野下智能机器人民事法律地位的认定［J］．河北法学，2019，37（6）：10-21 .
        ［15］周书环．聊天机器人的法律人格争议与传播侵权责任研究：基于 ChatGPT 场景视角［J］．南京社会科学，2023（6）：90-99 .

关注SCI论文创作发表，寻求SCI论文修改润色、SCI论文代发表等服务支撑，请锁定SCI论文网！

文章出自SCI论文网转载请注明出处：https://www.lunwensci.com/falvlunwen/76473.html

本文标签：生成式人工智能程序 ,著作权侵权 ,法律人格

发表评论

点击排行

谈相关立法解释和司法解释的

　第一种意见认为，刘某的行为构成贪污罪。全国...　详细>>

SCI论文范文

中国地方政府环境治理

如何设计有效的环境治理政策, 是学术界和政策...　详细>>

生成式人工智能程序的著作权侵权问题及规制路径论文

相关内容

发表评论

点击排行

SCI论文范文