导言:人工智能生成作品的技术路径与法律问题人工智能在人类创造性智力活动中发挥着重要作用,其智能生成内容,无论是思想内容的“表达”(expression)——作品,还是技术方案的“反映”(reflection)——发明,[1]都是智力创造活动的结晶。智能创造的实质,是使计算机模拟人类的某些思想过程和智能行为,具言之,其过程是以数据存储为基础,以机器算法为手段,以智能产物为结果。在文学艺术领域,从计算机到机器人的发展,是一个从阅读到创作的时代跨越。人工智能介入人类创作活动之中,使得计算机技术由单一辅助性创作工具跨入到人机合作创作、甚至相对独立创作的主体行列成为可能。在机器人时代,某些文学艺术作品就是人工智能生成内容。美国Narrative Science公司负责人在接受《连线》杂志采访时预测“未来15年将有90%的新闻稿件将由机器人完成”;[2]在设计领域,机器人参入面料、服装、珠宝甚至瓷器的设计,为图像技术的产业应用带来巨大变革。可以认为,诸如作曲、摄影、绘画、构图、作诗、舞台设计、视觉场景布局等文学艺术创作,无一不在人工智能生成范围之内。
人工智能的创作方式,大抵有两种技术路径:一是“代码定义”。在本世纪初大数据时代到来之前,人工智能创作的实现主要依赖于代码定义,即通过程序代码赋予机器以人类的思维方式或思维结构来完成某种作品的创作。以写作类智能机器为例,为了让机器写出人类可以理解的语句,需要通过代码编译使机器掌握人类写作思维中的元概念,如主语、谓语、宾语等句子成分,以及向机器输入人类写作思维中的语词结构。根据这一技术路径,人工智能创作的实现,几乎全部依赖于事前的代码编程,其技术思路实质上是借由代码编程将人类思维过程移植于机器。从机器对最终生成内容的贡献程度来看,程序代码更多是一种创作工具即辅助手段,其生成内容是机器作为创作工具而完成的作品。二是“数据训练”。自本世纪初大数据存储和处理技术出现以来,[3]人工智能开辟了数据训练算法的技术路径。数据训练集数据、算法、算力为一体,亦被称为“机器学习”型人工智能,即通过增强算法对海量数据进行统计分析和数学建模,从而“学习”人类的思维模式进而形成先进算力。可以说,机器的智能程度会随着数据的不断增加而提高,随着算力的不断增强而进化。仍然以写作类智能机器为例,机器不再致力于理解人类写作思维中的元概念和语词结构,而是从海量文本中统计、分析词与词的高频率搭配,提炼出通用的词组和句型并依据设计的数据模型产出人类可读的文本。按照一些专家的描述,上述机器的写作过程,大抵以大量文本语料的数据为基础,通过快速阅读并形成表达意思的专题模板,最后通过语言模型进行加工合成。[4]这种智能机器的生成物,实际上是人机合一完成的作品,也就是在人类指导或者说干预下所做出的创作。
从代码定义到数据训练,是为智能创作方式的不同技术路径,也是科学家实现机器智能愿景的发展历程。在当下人工智能应用实践中,机器生成内容的实现多是兼采代码定义和数据训练两种方法,它们不是互为替代的关系,而是互相支撑的关系,后者处于主导地位、发挥着决定作用。有鉴于此,本文将讨论对象界定为数据训练型人工智能。数据训练以机器学习为技术基础,后者是综合运用数学、统计学、计算机科学等知识而设计的一种优化算法,为人工智能的核心技术之一。机器学习可以使计算机以处理分析大量已有数据为手段拥有预测判断和做出最佳决策的能力。Arthur. L. Samuel于1959年将机器学习定义为:“在不经人为事前编程的情况下,赋予计算机学习能力的一个研究领域。”[5]后来Tom M. Mitchell对机器学习的概念作出了技术性的具体描述:“假设计算机程序从经验E中学习并完成任务T,机器学习就是提高完成任务T的性能P,而且性能P会随着经验E的积累而自动提高。”[6]上述定义中的“经验”,实质上是机器可读形式的“数据”。数据训练以机器学习为技术支撑,作用于智力创造活动领域,其技术过程可分为:数据输入—机器学习—结果输出。如图1所示:
人工智能时代的机器创作,已然跨越科学领域,浸染文化领域,继而在法律领域带来挑战。机器创作过程中“输入—学习—输出”三个阶段,不同于“人类中心主义”的著作权景象,这是一种与传统有别的“或然世界”或者说“后人类境况”。[7]其间所引发的著作权问题,可以概括为“机器读者”“机器作者”以及“机器作品”的著作权问题。无论是“输入”阶段的数据挖掘,还是“学习”阶段的算法创作,以至“输出”阶段的作品生成及其权利归属,诸多问题不仅与已有法律秩序形成冲突,甚至会颠覆我们业已形成的法律认知。现就著作权法所面临的主要问题概括如下:
问题一:“机器阅读”的行为性质问题。数据输入是机器创作活动的前提。人工智能的数据输入,可以称之为“机器阅读”,其阅读的文本就包括各类著作权作品。人工智能改变了作品的传统阅读方式,即海量数据的输入意味着对已有作品自动化和批量化的“阅读”。在“个人使用”范畴中,个人对作品的阅读和学习,是为著作权法规定的合理使用情形。[8]在这里,机器是否视为个人?批量“阅读”是否合理?以上属于“机器读者”的著作权问题。
问题二:“机器创作”的主体资格问题。“机器创作”活动实质上是机器学习技术的应用场景,即通过数据分析、算法学习,找到人类审美规则,形成表达文本。可以说,人工智能在改变作品“阅读”方式的同时,也改变了作品的“创作”方式。“后人类时代”的作品创作,在一些领域、一定范围是“数据驱动的创作”(Data-Driven Creativity)或者说“算法创作”(Algorithm for Authorship)。在人类较少干预或不参与的情况下,人工智能可以大批量地生成人类可理解的内容,包括文本、图画和音乐等。在机器创作活动中,谁是人工智能作品的作者?有无必要区分人类作者和“机器作者”?以上即是“机器作者”的著作权问题。
问题三:“机器作品”的可版权性问题。人工智能生成内容,在数据训练技术上是为机器算法规则、情感计算框架、文本表达模型等综合运用的结果;而在著作权法意义上具备了“思想表现形式”的作品外观。智能生成作品与人类创作作品,在“思想表现形式”及其独创性要求方面很难予以分辨。在“后人类时代”,作品的独创性即作品所蕴藏的作者个性应如何理解?智能生成物属于谁的“思想表现形式”?如何确定机器作品的著作权归属?以上是为“机器作品”的著作权问题。
一、数据输入:合理使用抑或侵权使用?
数据输入是人工智能创作的基础和前提。在数据训练的创作方式中,“大量的数据构成机器学习的训练数据库,成为算法创作(如写作、音乐制作)的主要原料与素材”。[9]形象地说,机器创作需要人类事先提供海量数据的“母乳”,而从事自主深度学习的主体是作为智能机器的“孩子”自己。数据是表现为计算机可读形式的知识和信息,这些知识和信息可能涵盖受著作权保护的作品(即数据集中的单个作品或汇编作品),对作品数字化处理(包括将作品原件处理为数据格式副本,或抓取已经数字化的作品)并集合输入智能系统的行为即是复制。著作权法意义上的复制行为可能是合法使用抑或侵权使用,这些就是数据输入所涉及的法律问题。
(一)知识信息数据化的著作权之困
文学艺术创作是一个持续不断的发展过程,借鉴旧作而创造新作,引用先知而开拓新知,是智力创造领域的普遍现象。阅读旧作、接触先知的著作权方案,主要有授权许可使用、法定许可使用和合理使用。三种途径属于著作权行使和著作权限制的不同领域:授权许可使用是著作权专有性效力的表现,创作者得以控制他人使用作品,通过授权许可即市场交易而得到智力劳动的成本回报;法定许可使用特别是合理使用则是对著作权的必要限制,在于合理划分作品创作者与使用者的权利边界,减少信息资源的额外交易成本,保证使用者对著作权作品的合理接触。在这里,无论是以占有复制件为基础的个人阅读,还是输入数据格式的“机器阅读”,都会涉及到合理使用的界定问题。
在印刷版权时代,复制是著作权作品利用的基本方式。对于个人读者即未来作品的创作者而言,必须占有作品的复制件才能阅读,换言之,个人的学习研究以至欣赏必须以占有作品的复制件为前提。在著作权制度框架中,复制行为受著作权人的专有权利控制,但个人使用(限于本人及其家庭且为非商业性使用的私人复制)、科学研究使用(以学术研究为目的且为内部使用的少量复制)则归类于合理使用的范畴。在早期著作权司法实践中,英国法官认识到未经允许使用他人作品的合理性,即允许后来作者以创作新作品为目的,以诚实使用为原则,可以不经允许、不付报酬而使用在先作者的作品。[10]但是私人复制构成合理使用,必须以尊重作者权益为前提,即使用他人作品而创制的新作不得挤占原作的市场(1807年“Worth v. Wilees”案),使用他人的作品必须有数量的限制和价值的考虑(1836年“Bramwell v. Halcomb”案)。[11]自1841年美国法官Joseph Story在“Folsom v. Marsh”一案提出合理使用认定规则后,[12]美国法院不断深化和发展合理使用这一普通法制度,并对该国著作权立法产生了重要影响。美国学者对19世纪合理使用进行了概括和总结,主要有保护著作权人专有权利的“市场原则”、保护公众阅读著作权作品的“接触权原则”、允许私人复制著作权作品的“个人使用原则”。[13]
在“数字版权”时代,作品以虚拟的数字化形式存在于网络空间。人类读者对作品的接触,从有形载体的复印件转变为数据形式的复印件,“与传统环境中购买有形复制件相比,人们开始习惯于通过数据形式进行阅读和观赏,作品的价值也在数据传播中得以体现。”[14]对于人类读者而言,无论是有形载体的复制,还是数据形式的传播,概以接触著作权作品原样即初始“思想表现形式”为目的。基于智力创作和学术研究的需要,现代著作权法为个人使用提供了合理使用的制度空间。当下的问题是,“智能版权时代”出现了大量的“机器读者”。所谓数据输入就是机器阅读作品,即人工智能对知识和信息进行数字化处理和存储的利用状态,没有数字输入就没有机器创作。
“机器读者”对作品的接触,在数字技术方面有两种实现形式:一是将非数字格式的原本内容转化为计算机可读的数据格式,通常称之为“原件扫描”。例如谷歌数字图书馆在世界范围内扫描图书并形成一个中央集成式数据库,其目的不是为了人们阅读,而是满足人工智能创作需要(包括文献搜索、语言模式、智能翻译等)。二是对他人已有的数据格式通过API等应用程序接口访问和获取文本内容。例如斯坦福大学李飞飞教授制作用于计算机图像识别的图片数据库,开放给全球科研人员免费使用。[15]从著作权利用的法律途径来说,则涉及三个问题:①授权使用。机器创作需要海量文本数据作为学习素材,对每一作品都要取得授权,交易成本未免过高;而通过购买数据库的方式来获取版权材料,往往由于数据格式的内容偏好或容量限制,难以满足数据输入的需要;②合理使用。个人使用或者说私人复制是著作权效力限制的公共领域,可以满足机器创作中的海量数据需求。但是,传统的合理使用制度是以自然人为中心所创设的,在这种情况下,机器能否视为个人?“智能版权时代”面对的问题是:同为智力创作的目的,却要区别“人类读者”和“机器读者”的不同身份,并对他们利用著作权作品的边界作出明确规定;③法定许可使用。这一制度可以简化著作权作品获取环节,允许数据输入无须获得许可而直接使用作品,但需向权利人支付合理报酬,保证后者的经济利益。这里的问题是,法定许可使用需由法律规定,而“机器阅读”在著作权领域尚属立法空白。以简化使用程序、减少交易成本为指向,合理使用和法定许可使用无疑是数据输入的有效途径,前者“偏向技术进步”,后者“兼顾各方利益”。[16]无论如何,当代法学工作者和立法者有必要对此作出学理解释和制度选择。
(二)机器阅读作品的合理性之道
人工智能创作涉及著作权的首要难题,是机器学习中训练数据的获取和使用的合法性问题。诸如扫描、抓取、存储等数据输入行为,是合法使用还是侵权使用,决定了机器学习(创作)和结果输出(作品)等后续行为是否正当。机器自由阅读海量作品的法律路径,即是著作权法上的合理使用和法定许可使用。
合理使用是公众对著作权作品自由使用的权利,也是法律对著作财产权效力的限制。从个人阅读到“机器阅读”,接触和使用已有作品来创造新的作品,其行为是否“正当”和“合理”,需要根据一定的裁判规则来衡量。在司法实践中,传统的“四要素”认定标准(即作品使用的性质和目的、被使用作品的性质、作品使用的数量与质量、被使用作品的市场或价值影响)和现今盛行“转换性使用”判定规则,都是关于合理使用案件的重要裁判方法。“转换性使用”(transformative use)规则从合理使用“四要素”判断法发展而来,强调使用作品的目的和特点是“转换性”的,即新作品采用了不同于原作品的新的表达方式、含义和信息。这意味着,使用行为的合理性判断,并不拘泥于对原作品使用性质与数量的限制,直言之,与数据输入中对作品自动化、批量化的阅读方式无关。上个世纪90年代,Leval法官从著作权法鼓励智力创作的立场出发,将“使用的目的和特点”这一要素深化为“转换性使用”,其主要观点是:①使用是否达到著作权法“促进知识、鼓励创作的目标”,这是考察使用目的的核心问题;②使用如果是以与作品不同的方式,或是为了与原作品不同的目的,即为“转换性使用”;③“转换性使用”使新作品不同于原作品,因而是创造性的,属于合理使用。[17]“转换性使用”规则是为有代表性的主流观点,成为美国法院审理合理使用案件的重要认定标准。与传统“四要素”标准适用中的机械主义和教条主义不同,这一规则突出“使用目的”第一要素的重要地位,满足了鼓励创作和知识增值的立法目标。但是,“转换性使用”在理论上并不周延,在适用中也存有模糊性。所谓“转换性使用”并非一定就是正当目的的使用,如未经允许而对作品的翻译、改编等。正如美国学者所指出的那样,有些“转换性使用”也可能不具备合理使用的条件,因为这种使用是著作权人独占权利范围内的使用。[18]因此,我们在解读数据输入的合理性时,应以“转换性使用”规则为基础,同时也要考虑其他要素的影响和作用。在“数据驱动创作”的语境下,大量的数据既是智能创作的素材,也可能是受著作权保护的作品,其数据输入的合理性证成,除适用“转换性使用”中知识增值目的外,还须考量以下问题:
一是“使用目的”要素与“市场影响”要素的关系。在美国学者的著述中,“使用的目的和特点”是合理使用认定的第一要素,是整个合理使用规则的灵魂,而“对原作品潜在市场或价值的影响”,被法官称为“合理使用中唯一最重要的因素”。在这里,“使用目的”要素属于主观范畴,其正当性与否,往往依赖于对客观市场影响的考察,或者说进行主观目的与客观后果的综合分析。为机器创作而输入数据(即使用作品),这些数据通常属于创作的主题、体裁、题材等思想范畴,而与作品的思想表达无关(如后续作品在表现形式方面与在先作品构成实质性相似,则以侵权论)。“市场影响”要素的意义,在于维系使用者利用他人作品的利益(主要是非物质利益)和著作权人控制作品使用的利益(主要是物质利益)之间的平衡。“市场影响”要素的关键在于有无损害的发生,借用合理使用要素倡导者Story法官的话来说,应考虑这种使用是不是取代原作品的使用。[19]这说明,数据的挖掘与分析,是否对著作权人造成“实质性利益”损害,是评价“使用目的”的重要尺度。
二是“转换性使用”的目的与商业性使用目的的关系。在传统“四要素”判断规则中,“使用目的”要素意在考察作品使用“是否具有商业性质或者用于非营利的教育目的”。“商业性质的使用”在表述方法上是一种排斥法,凡符合这一情形,即不属于合理使用范围。这是因为,合理使用本质上是对他人作品的无偿使用,同时意味着也不允许以营利为目的使用他人作品。而在“转换性使用”规则中,“商业性质的使用”不再是合理使用认定的关键,重要问题是考察新作品的“转换性”程度。合理使用认定思路的调整,使得商业领域中机器阅读作品的正当性证成变为可能。在美国合理使用文献中,商业化机器阅读分为“非表达型机器学习”和“表达型机器学习”两类。[20]一般认为,前者的作品使用具有目的转换性,即“作品的复制没有将该作品的独创性表达传播给社会大众”。[21]例如人脸识别,即提取人脸图片的设计思想和功能特征,并用这些人脸数据训练人脸识别算法,因没有利用原作品中受保护的表达性内容,是为合理使用。而后者则是用作品的表达性内容来训练算法,使其输出“转换性”的内容表达,即采取具有内容转换性的新的表达。在“普通表达型机器学习”的形态下,用于算法训练的作品来自众多作者,并形成作者共同体内部通用的表达模型,可能构成合理使用。而在“私人表达型机器学习”形态下,用于算法训练的作品全部来自某一作者,并生成特定私人化的个性表达,其实质性相似的模仿难以构成合理使用。
三是“机器读者”利益与“人类作者”利益的关系。机器阅读作品可能形成知识增值即产生独立于原作品的新价值,这种“转换性使用”所产生的数据价值不受原作品著作权的控制。这种合理使用类型,可以视为新技术背景下对作品新的利用方式的一种激励。在人工智能时代,著作权作品即人类作品的思想表达成为“数据工厂”的原料,对作品的复制仅是“流程性输入”。[22]没有合理使用制度,数据挖掘和分析就失去合法性基础,这即是“机器读者”的利益所在。相形之下,人类作者在数字化技术面前,不能控制人工智能对自己作品的使用,也不能取得报酬,由此可能造成“机器读者”与人类作者之间的利益失衡,著作权法似有考虑的必要。其实,实践已经走在理论的前面,在一定领域和范围,机器阅读作品即数据输入的许可市场已经形成。诸如美国谷歌、脸谱、亚马逊、中国阿里巴巴、腾讯、百度等大型网络科技公司为用户提供了创作作品的手段和分享作品的平台,即“用户创造内容”;同时,这些网络科技公司在其服务条款或用户声明中都有相似规定,即用户授予公司免费使用作品,包括数字化使用,[23]这是一种特别的许可市场和许可使用方式。由此可见,数字输入过程并非全是合理使用的场景。
法定许可使用既是对著作权效力的限制,也是著作财产权利用的方式。综观各国关于法定许可使用的规定,可以看出:使用者多为表演者、录音制作者、广播组织者,涉及的是作品创作者(著作权人)与传播者(邻接权人)的关系。该制度是为简化著作权手续、促进作品传播而设定。有学者建议,为促进机器学习技术发展,法定许可使用制度在简化作品和使用的同时,保证了作品权利人的经济利益,实现了机器学习技术研发者与作品权利人之间的利益平衡,不至于形成以剥夺作品权利人利益为代价而服务于人工智能的现象,因此法定许可使用较之合理使用更具优势。[24]这一主张是有意义的,但付诸法律规定是不容易的。笔者在20多年前的著述中谈到一个重要现象,即现代传播技术扩大了作品使用的方法和途径,同时也带来一定范围内合理使用向法定许可使用转变。在电子版权时代,版权工业集团对限制合理使用的要求,主要针对个人、家庭、图书馆复制和录制作品的情形。自20世纪70年代以来,美国、德国、丹麦等发达国家在传统的“合理使用”范围内,对作品使用征收“复印版税”和“录制版税”,这实质上是对著作权限制的反限制。[25]在人工智能时代,围绕数据输入,如何划分合理使用与法定许可使用的边界,法定许可使用制度的技术支撑、法律规制和实施保证如何解决,这些无一不是难题。就著作权制度选择而言,各国立法者主要是采用合理使用之道,但秉持不同的政策立场。
(三)“数据训练”著作权例外的法律之路
文本数据存储、挖掘为后续的机器学习以至结果生成提供了材料支撑,是人工智能时代科研活动和商业开发的重要基础。基于鼓励智力创作、促进机器智能产业发展的目标,欧美发达国家大抵通过成文法和判例法,确立了文本数据存储、挖掘的著作权例外,但其合理使用的适用范围、构成条件等有所不同,表现了各自的法律传统影响和立法政策考量。
美国秉持“转换性使用”为基础的宽松立场。美国通过判例法将文本数据存储、挖掘纳入合理使用范围,其裁判基础即是“转换性使用”理论。1994年“坎贝尓”(Campbell)案将作品的戏仿性使用解释为“转换性使用”,由此认定内容上转换使用、目的性转换使用以及功能性转换使用,均为著作权例外的合理使用。[26]在2016年“美国作家协会诉谷歌案”中,法院认为,谷歌为了提供文本数据挖掘和分析服务而对作品的复制和展示,具有“转换性”意义,构成合理使用。[27]从戏仿性使用到数字化使用,是传播技术发展的重大时代变迁,美国判例法出于“知识增值”的基本立场,对“转换性使用”规则采取了宽泛解读的全面适用,以适应“机器阅读和创作”之需。
日本采取“计算机分析例外”的灵活态度。日本著作权法于2009年进行了修订,以“计算机信息分析”的名义规定了文本数据挖掘的著作权例外,这被认为是人工智能时代相关规定的最早立法例。2018年日本著作权法再次修订,将作品利用的目的规定为“提供新的知识和信息”,以替代原来“信息分析”的限定。[28]从两个修正案不难看出,立法者对著作权例外制度采取了一种开放、灵活的态度:一是借鉴美国“转换性使用”理论,允许信息处理人对他人作品进行复制和向公众提供,但以“提供新的知识和信息”的转换使用为必要;二是不以商业性目的与否作为判断标准,著作权例外没有限定为非商业性目的的使用,其弹性规定为科研领域特别是商业领域对作品的数字化使用,留下了足可适用的制度空间。
欧盟选择“非科研目的”例外的谨慎方案。进入新世纪第二个十年,欧洲国家先后在其著作权法修正案中规定了“文本数据挖掘”的例外条款,如2014年英国版权法、[29]2016年法国著作权法、[30]2017年德国著作法,[31]允许对著作权作品进行复制,但限于非商业性的研究目的。2016年欧盟委员会提出的《版权指令》草案,规定文本数据存储、挖掘的著作权例外,适用主体为公共机构和科研组织,以非商业性目的为潜在语境,反映了欧洲国家谨慎立法的立场。[32]但是2019年欧盟议会通过的《单一数字市场版权指令》,将适用主体扩展至含有商业性开发意义的私人主体,同时又允许著作权人以明示方式保留作品用于非科研目的的文本数据分析的权利。[33]适用范围的扩大与权利例外的保留,表明上述规定是一种“有限开放”条款,反映了欧盟谨慎立法的政策选择。
在人工智能时代,文本数据存储、挖掘的著作权例外,已成为一些国家的制度安排。为鼓励智力创作活动,促进智能产业发展,我国即将通过的著作权法修正案,应对这一问题作出回应。总体而言,可供选择的制度回应方案有两个:一是借鉴欧盟和日本,在立法中将“文本数据挖掘”增列为一项新的合理使用情形;二是效仿美国,在立法中增加合理使用认定的一般条款,同时在合理使用法定列举中增加兜底条款,法院在司法实践中可根据案件具体情况援引以上两个开放式条款将人工智能对作品的利用认定为合理使用。2020年4月30日,全国人大常委会公布《著作权法(修正案草案)》(以下称《草案》),向社会公开征求意见。《草案》将国际公约中的“三步检测法”写进了合理使用条文,看似引入了合理使用认定的一般规则,其实仍未改变合理使用认定规则的封闭性。“三步检测法”中的判断步骤为:在特殊情况下,不得影响作品的正常使用,不得不合理地损害著作权人的合法利益。而《草案》中引入的“三步检测法”,将“在特殊情况下”界定为“在下列情况下”,而法条下面只列出了12种合理使用情形。如此,法院只能在认定12种法定合理使用情形时将“三步检测法”作为辅助性考虑因素,而不能依据三步检测法”在法定列举之外认定包括文本数据挖掘在内的其他合理使用情形。可以认为,《草案》对合理使用制度的修改,不足以回应人工智能技术对作品的利用。本文建议,新的著作权法修正案应采取开放、包容和灵活的立法取向,在引入“三步检测法”之外,应将“文本数据挖掘”增列为一项新的合理使用情形,正面回应人工智能技术的作品利用问题。
二、机器学习:谁是“算法创作”的作者?
“机器学习”是人工智能创作的实施阶段。在数据训练的创作方式中,通过文本数据的存储与分析(创作基础),模拟主题与体裁的写作模板(创意方向),训练创作成果的指定目标和完成样态(创作标准),形成特定意思表达的文本(生成作品)。这是一种类人化的“算法创作”。谁是“算法创作”的作者?在著作权法律关系中,主体资格的取得大抵有两种情形:一是通过智力创作的事实行为而成为主体的自然人作者,二是基于法律规定的主观拟制而视为主体的法人作者。一般认为,作者概指进行创作行为的自然人,法人只有在特定条件下“视为”作者。从现行的著作法规定和已有的著作权认知出发,“算法创作”所引发的创作行为标准、主体资格标准问题,无疑是我们面对的难题。
(一)创作的人格基础与“算法创作”中的创作主体
在“作者权体系”的语境中,“人格价值观”是著作权立法的哲学基础。康德讲到,作品是人格的反映,作品本质上是作者的意志。[34]黑格尔也指出,诸如学问、知识、艺术等,是一种内部的精神的东西,作品在本质上表现了作者个人的独特性,是作者自身精神和技术才能的产物。[35]正是在启蒙思想家的影响下,大陆法系国家的立法者创制了与普通法上“版权”(copyright)不同的“作者权”用语(法文“droit de auteur”、德文“Urheberrecht”、西班牙文“derecho de autor”、意大利文“diritto de autore”等,无一不是“作者权”的语义表述)。[36]基于“人格价值观”的理念,这些国家极力推崇作者在著作权法中的地位,对作者即自然人、作者即第一著作权人等问题作出了明确而细密的规定。
以“人格价值观”为基础所构建的创作行为标准和作者资格标准,是“人类中心主义”的产物,具有创作的意志性和作者的主体性之要义,它没有也不可能涉及人工智能“机器创作”的情形。著作权法所称的创作,是直接产生文学艺术作品的智力活动,具有思想表达的意志性特征。具言之,创作就是人运用文字、数字、图形、色彩、音符等构成要素,按照一定的规律、规则和顺序而有机组合的形式,以表达其思想、情感、观点、立场、方法等综合理念的活动。从创作行为的标准出发,作者有其主体性特征,包括自然人和自然人的集合体即法人。在一般情况下,具有创作能力且有创作活动并产生创作成果的自然人即为作者;而在法律特别规定的情况下,“由法人或者其他组织主持,代表法人或者其他组织意志创作,并由法人或者其他组织承担法律责任的作品,法人或者其他组织视为作者”。[37]
人工智能基于深度学习而生成具有作品外观的思想表达,这种自我学习、自我思考、自我输出成果的过程,似为某种意义上的创作,但在著作权法框架里无法成就其主体资格。在民事主体理论中,“自然人格”是人之所以为人的主体资格,而“拟制人格”是法律对自然人的集合体即法人所拟制的主体资格。首先,著作权法规定了自然人的主体中心地位,将其作为权利原始主体、完整主体,即第一著作权人。这是因为,只有自然人才是作品的真正创作者。作品是人类的创作成果,表达的是人类的思想情感。[38]人类在创作领域的意志能力,表现为一定的审美力、想象力、表现力即思想表达能力,这是自然人之所以为作者的“自然人格”基础;同时,著作权法有条件地将法人“视为”作者。在这里,法律规定的情形、法人作品的意志体现以及法人责任的承担,是“视为”作者的前置条件。“法人作者”是一种“拟制人格”,即以法人名义所表现的共同意志和法律拟制的团体人格。无论是人合组织还是财合组织,法人的意志、行为根源于自然人,但法律通过主观拟制将自然人的意志、行为归属于法人。应该看到,人工智能没有自然人和法人的意志能力,类人化“算法创作”是机器学习的产物,其智能化的算法行为不同于人的理性的、情感的意思行为;同时,人工智能没有独立的财产,也没有独立的责任能力,其发生的著作权纠纷,最终责任的承担者都将是人。正如美国学者所言,机器人因不具备主观意识而不能成为作者,也没有责任能力而不能成为侵权者。[39]
尽管人工智能没有独立人格,不是著作权法意义上的作者,但“机器学习”过程是一种类人化的创作行为,其生成内容具有思想表现形式的作品外观。我们不能否定人的主体地位,也不能颠覆“人是目的”的哲学原理,但理论界需要对人工智能创作提出新的认知和构想。
(二)“人类创作中心主义”与“赛博格”(Cyborg)
机器介入创作由来已久。从辅助创作到“算法创作”,突破了“创作人=自然人”的“人类创作中心主义”的限定,标志着“后人类时代”有关主体性的一些基本假定发生了意义重大的转变。[40]1974年,美国国会成立“版权作品新技术利用委员会”(英文简称CONTU),调查新技术特别是计算机技术对版权制度的影响。1979年,CONTU在向美国国会提交的最终报告中,认为版权法不需要对机器生成的作品作出特殊规定。因为人类依然是创作的中心,计算机只是创作的辅助工具,不能自主生成作品。该报告还宣称,计算机自主创作在短期内是不可预见的。[41]时过境迁,机器人自主创作已然到来:2015年,谷歌机器人Deep Dream创作的绘画拍卖成功;2016年,纽约大学机器人Benjamin创作的科幻电影在伦敦发布;2017年,微软机器人“小冰”出版自己的诗集《阳光失了玻璃窗》。这些事实说明,智能机器正以“或然世界”的表达走向人类创作的中心世界。面临人工智能技术裹携后人类思潮冲击的,不仅是文学艺术领域的“人类创作中心主义”,而且也涉及到科学技术领域的“人类发明中心主义”。本来,“人类中心主义”是近代以来人类摆脱上帝权威而确立自身中心地位的思想变革。进入人工智能时代后,“人类中心主义”的主张出现重大危机:人类在创造性活动中独一无二的主体地位受到挑战,在自然层面和社会层面的主体性假定也被改写。这意味着,人工智能时代在本质上或许是一个“非人类中心主义”。19世纪,哲学家尼采发出“上帝已死”的世纪呐喊;21世纪,“人类将死”则成为社会风险到来的世纪警言。按照一些学者的说法,人工智能时代就是“后人类时代”。“人类的主体地位不断衰落,人以前独霸主体资格的状态已经成为过去,代之而来的是由人、动物、甚至机器人共同享有的这么一个时代。”[42]
在法学界,对“非人类中心主义”主题的涉猎,源于动物法律人格和非人类生态权利的论战,[43]而今天则为机器人是机器还是人的主题讨论。“赛博格”(Cyborg)是“后人类时代”的核心概念,Cyborg由Cybernetic(“控制论的”)与Organism(“有机体”)缩写与合并而成,早先出现在科幻作品,后扩展其内涵,最终作为专有名词用以界定人类虚拟身体的机器人。文学界、法学界的一些学者对Cyborg所引发的创作主体人格问题给予了高度关注。[44]后人类思潮或者说后人文主义以一种“整体世界主义”的思维方式,试图重新调节“人类中心主义”思想和行为的偏差。有学者甚至主张人类有必要修正对于“人”的定义,将“基因人”“赛博格”等纳入到“人”的范畴中,重构法律的框架,重构各种“人”之间的关系,重构“人”与万物的关系。[45]由于论题所限,笔者无意评论这一观点,但就“算法创作”而言,讨论“赛博格”即机器人与自然人之间的关系,应该是有意义的。
创作本是产生于人类精神领域的智力活动。机器介入创作,在技术原理上表现为一系列的数据挖掘、分析和运算,以模仿甚至取代人类创造性的智力活动。这种机器智能与人类的心性和心智是不同的,它是一种“理性的计算”“情感的计算”,从而表现了类人化的意志能力。正是在这个意义上,人工智能不再是物质存在的辅助创作工具,而可能是与人类作者合作的“创作机器”或者说相对独立的“机器作者”。到目前为止,智力创造领域中的人机共存、人机合作已成为新的社会特征,机器在人类指导下完成技术方案和智力作品的生成内容,应是人工智能开发者思维、意志的延伸。“控制论”是基于当下“弱人工智能”阶段的基本判断,而在“强人工智能”和“超人工智能”的未来,机器有可能独立自主地进行智力创造活动。未来学家声称,21世纪将是一个机器科学家与人类科学家并存的时代;[46]我们同样可以说,在文学艺术领域,则会出现“机器作者”与人类作者合作的时代。“机器科学家”和“机器作者”不再完全是人类控制的工具,有可能取得类法律人格,有的学者将这一过程描述为从“控制论”到“拟制论”的法律变革。[47]也许我们无法规划未来,但可以反思当代:创作行为并非一成不变,人工智能技术的发展和运用,使得精神生产活动呈现以往没有的样态;机器介入创作,重现、延伸和拓展了人的创造能力,无疑丰富了文学艺术领域中作者的内涵。如何认识“后人类时代”创作主体,这是著作权理论需要回答的问题。
(三)后人类时代“作者—著作权人”主体结构重塑
人工智能广泛应用于社会,人机交互、人机协同、人机共生的人机关系正在发生。[48]在智力创造领域,人类不再是精神生产活动的唯一承担者。机器介入发明和创作,以类人化的方式与人类共享思维、意志,实现精神层面的交互,这就是人机合作生成的发明和作品。根据人工智能与智力创造的频谱关系,从机器在最终生成内容即智力成果中的贡献力程度出发,专利权领域有合作生成发明,而在著作权领域有合作生成作品。人机合一是“后人类时代”人工智能类人化、创造智能化的一种具体表象和客观存在样态。
在著作权法语境中,合作作品通常是指两个以上的人合作创作的作品,合作者相互须有共创作品的合意,同时又实施了共创作品的行为。各创作者对创作的实质性贡献,包括作品的构思、建议、表达、修正或增删等,最终配合或组合成一件完整的作品。“算法创作”的作品是“机器作者”与人类作者(智能机器的开发者或操作者)合作创作的作品,是“智能版权”时代合作作品的特殊类型。观察机器学习的过程,我们可以窥见合作者各自的实质性贡献:智能机器基于深度学习能力,自行选择、识别、分析数据,最终脱离限定的算法预设,生成符合人类思想表达的作品。其生成内容既表现了超越原始设定的行为随机性,又产生了符合人类审美取向的质的规定性。这是“机器作者”类人化的智力创作;智能机器的操作者进行数据输入,包括筛选与优化,是机器学习即创作的前提。同时,对结果输出给予特定指令或目标,是生成作品内容和形式的决定性因素。[49]可以认为,“算法创作”体现的是操作者的创作意志,这是人类作者借助智能化所完成的合作作品。
以合作作品为人机合一的作品类型,以实质性创作贡献来界定“机器作者”与人类作者的主体身份,符合著作权法所蕴含的机理。英国1988年《版权、设计和专利法案》第9条第3款、新西兰1994年《版权法》第5条、南非1978年《版权法》第1条(h)项,均规定计算机生成的文学艺术作品之版权,归属于对作品的创作进行了“必要安排”之人。“必要安排”的实质性贡献原则,同样可以解读人工智能创作的情形,但是,人工智能生成不同于过往的计算机生成:第一,人机合一完成的作品,应确立“机器作者”与人类作者的二元创作主体结构。前者是“视为”作者,即基于创作事实而做出的假定;后者是基于法律规定而当然成为作者。二元创作主体结构旨在说明“机器创作”作品的性质以及“机器作者”的身份,是对“后人类时代”创作活动的新的认知。第二,对人机合一完成的作品,应建构“作者—著作权人”二元权利主体结构。作者与著作权人是可以分离的,作者未必是第一著作权人,即使将人工智能“视为”作者,在人与人的社会关系中,“机器作者”也无法如同人类作者那样去享有权利、履行义务并承担责任。关于这一问题后文还将讨论。
三、结果输出:著作权法能否提供保护?
“算法创作”的结果输出,是机器算法规则、情感计算框架、文本表达模型等综合运用的结果,这一生成内容在著作权法上即是具有思想表达外观的作品。关于何种结果输出能够得到保护,微软公司亚洲研究院提出了人工智能创造的“三原则”:第一,人工智能创作的主体,须是兼具IQ与EQ的集合体,而不仅是IQ;第二,人工智能创造的产物,须能成为具有知识产权的作品,而不仅是某种技术中间状态的成果;第三,人工智能创造的过程,须是对应人类某种创造力的行为,而不是对人类劳动的简单替代。[50]“三原则”中的核心问题是机器生成物的法律属性问题。可以认为,“结果输出”的著作权法之问,其主要问题是智能生成物可版权性及其著作权归属。
(一)人工智能生成内容的“可版权性”
著作权的保护范围与创作者的思想表现形式相联系而存在。“思想表现形式”也称为“思想表达”,是著作权理论中最基本的逻辑概念,它在文学艺术创作领域具象为作品。一般而言,作者的创作过程概括地分为两个方面:一部分是为思想内容,存储在作者的大脑之中;而另一部分则是思想表达,即外在呈现为一种可为他人认知的“思想表现形式”。这种思想表现形式是作品完成的最终形态,其具体类型包括文字作品、音乐作品、绘画作品、图形作品等。“算法创作”与人类创作有类似之处:数据的存储、分析与机器学习,是为思想内容的精神生产;而结果输出的生成内容,则是符合人类审美需求的思想表达,在作品类型及其外观方面与人类创作的作品无异。无论是人类作者还是“机器作者”所提供的思想表达,要成为著作权法所保护的作品,须满足两个基本条件,即独创性与可复制性,这即是作品的“可版权性”的要求。
理论界关于智能生成内容“可版权性”问题的讨论,主要聚焦在该类作品是否具有独创性特征。一些学者认为,人工智能生成内容不能认定为著作权法意义上的作品,因为它们都是应用算法、规则、和模板的结果,不能体现创作者的独特个性,同时也不是人类主体的情感表达。
该生成内容虽具备一般作品外观,但缺乏内在人格基础。[51]多数学者主张人工智能生成内容是著作权作品,机器输出结果是遵循人工智能设计者意志创作的产物;人在“算法创作”中的充分参与带来作品的人格要素;作品独创性判断对象只能是已经生成的表达本身,即著作权作品之认定应根据已经生成的表达结果进行推定。[52]关于人工智能作品独创性的证成,除以上论点外,笔者以为还应强调以下三点认识:
第一,独创性要义在于创作的独自性和原创性。依世界知识产权组织的权威解释,作品独创性意义在于“作品是作者自己的创作,完全不是从另一作品抄袭来的。”[53]对“机器作品”与人类作品应持同一认定尺度,只要前者是“算法创作”自己生成并与他者不同的结果,就应视为具独创性条件,而无需另立标准、施加严苛。智能系统在具体表达上往往自行分析、选择数据,改变限定的标准预设,其生成内容实现了人类心智活动的“无机化”,并表现了人类无法预知的随机性”。这即是人工智能独自完成的“个性”表达。
第二,独创性基础是思想表达具备的人格要素。“作品是作者人格的反映”。所谓人格,既蕴含在人类内在思想之中,又显见于人类思想表达之外。诸如立场和观点、体验和情感的思想表达,是创作主体具有个性即人格性的表现。在人机合成的创作中,机器作品依然是智能系统在人类指导下完成的作品。如前所述:鉴于一定价值标准对输入数据进行选取,遵循一定审美取向对机器学习进行修正,依照思想表达要求对生成内容进行目标界定,无一不体现人工智能作品的内在人格要素。
第三,独创性判断来自作者以外的社会评价。独创性是一个比较性概念,在知识产权纠纷中,比较性判断是识别智力成果相似性的重要尺度。换言之,某人成果与他人成果构成相同或近似,则其独创性(作品)、首创性(发明)、可区别性(商标)不能成立。例如,在技术发明可专利性判断中,“最接近的现有技术”和“所属领域的普通技术人员”是创造性比较判断中最重要的“参考系”。就作品独创性认定而言,在思想表达的外观上难以辨识“机器作品”与人类作品的差异。直言之,创作者身份不应是作品受保护的构成条件,著作权法应该考量的是:“机器作品”与他者作品不构成“实质性相似”(实质标准),并基于以人类读者为基础的“一般社会公众”认可(评价标准),即可作为著作权作品看待。
综上所述,独创性认定是以思想表现形式和人格主义要素为基点。人工智能生成作品与人类创作作品,在“思想表现形式”即作品外观方面难以区分,它们只要满足独创性要求,即可能具备“可版权性”。同时,著作权总体而言是一种人格主义范畴的权利,所谓“算法创作”生成内容不是技术上的机械性“反映”,而是一定思想内容的表达。有学者形象地将“机器作品”与摄影作品进行类比:机器生成作品的过程如同按下快门的瞬间,看似缺乏人类参与,实则人类在机位设置时已付出了颇费匠心的安排。[54]因此,我们应该寻找人工智能创作中的人格要素,对“机器作品”的“可版权性”做出合理解释,这一认知并没有离开著作权法的哲学根基。至于人工智能发展的未来时代,“算法创作”将更多在自我意识、自我思维的状态下完成,其成果在符合独创性条件下能否受到著作权法保护?笔者认为,只要有人类介入,即意味着这一生成内容涉及人类思想表达,著作权法对此不能简单采取排斥的立场。
(二)人工智能作品的著作权归属
关于人工智能生成内容的权属问题,我国学者从“算法创作”的意志体现、“机器作品”的生成机理、实质性贡献原则、利益平衡理论等多个方面进行考量,提出不同的见解。主要观点如下:
“作品——著作权说”。该观点认为,人工智能生成内容应为具独创性且有人格要素的作品。在人机合成创作的情况下,“机器作者”与人类作者都对作品作出实质性贡献,其著作权归属可参照法人作品规定或创作者约定处理。[55]后文将详述。
“投资——邻接权说”。该观点认为,人工智能创作物因投资人的“非创作性”投入而产生,投资人的利益应当成为相关法律制度的保护重心。广义的邻接权客体包含了那些有思想表达但又不构成作品的内容。因此,对人工智能创作物,根据“额头出汗原则”,法律应当给予一定保护;同时,又要体现人类作品与智能产物在法律保护上的区别,即智能设计者的权利与智能生成物的权利区分开来,后者权利就是为了保护投资者利益而存在的邻接权。[56]
“孳息——所有权说”。该观点认为,人工智能本身属于物的范畴,不能成为著作权法上适格主体,其产生物即生成内容依据性质是一种“物生物”的关系,而传统著作权法上作者与作品的关系,是一种“人生物”的关系。“知识财产孳息”,是人工智能生成作品的民法学解释,即机器创作物是独立于原物(即人工智能)所生之新物(即知识财产孳息)。该智能创作物的权利归属,可兼采罗马法上的“原物主义”原则与日耳曼法上的“生产主义原则”,认定人工智能的开发者、使用者或者所有者为著作权人。[57]
上述观点的不同,其焦点在于对“机器作者”身份和“机器作品”属性的认知差异。基于前面的分析,笔者认为“作品——著作权说”更为可取。依著作权主体制度规定,自然人作者和法人作者在作品创作完成时,根据“权利自动取得原则”而成为著作权原始主体,这即是作者为第一著作权人的情形。在人工智能时代,我们可以建构“作者—著作权人”的二元权利主体结构,对创作主体资格与权利主体资格实行界分,即作者未必是第一著作权人。具言之,基于“算法创作”的事实,未来法律可以拟制“机器作者”,但却不能认定智能机器的著作权人资格。民法学者谈及民事主体的人格时,强调其必须具备人的生物学、心理学、以及社会学的基本要素。[58]机器人没有独立的意思能力(包括完全的自由意志、自主意识),也没有特定的社会角色(包括具有的社会属性和获取的社会品性),因此不能作为著作权人去理性并真实地享有权利、履行义务和承担责任。概言之,凡是权利的主体必为意思的主体。著作权人应是自然人或自然人的集合体。现代著作权法立法宗旨通常表述为:保护创作者专有权利,鼓励作品创作活动,促进社会文化和科学事业发展。必须指出,鼓励作品创作与传播的立法宗旨,不会因为创作者是人类还是机器而有所改变,但基于著作权法激励功能而产生创作动因,能够践行立法宗旨的权利人只能是自然人和法人。[59]
关于著作权归属的制度选择,有两种模式:一是创作者权属模式。“算法创作”需要众多主体参与,包括设计算法程序、输入信息数据、进行标准检测等各项内容的支持。在这里,确定人工智能著作权归属,应以对作品创作做出实质性贡献为标准,至于是单一权利人还是共有权利人在所不问。创作者权属模式适用于非法人作品情形,相关权利归属和分配依事前协议确定;二是投资者权属模式。当下“算法创作”多由法人组织充当智能技术的主要开发者或所有者。例如研发“Watson”的IBM公司、推出“小冰”的微软公司等。在这种情形下,可适用法人作品或职务作品的有关规定来确定著作权的归属。
(三)人工智能时代著作权立法动向与法律实践
关于人工智能生成作品著作权保护的立法问题,欧美国家的法学家、法律家们既有激烈的争论,也有积极的建议。美国版权立法对人工智能作品著作权未作回应,或者说对该类生成作品持有拒绝的立法立场。[60]就其他国家立法动向而言,大抵有两种情形:一是援用已有著作权条款,扩大法律适用范围,对“机器作品”提供著作权保护。英国版权法1998年修正案,规定计算机生成作品”,由对该作品的创作进行了“必要安排”之人享有著作权。在英国法传统上,“必要安排”认定的基础是“实质性贡献原则”,对“算法创作”进行“必要安排之人”可能是智能系统的投资者、开发者或使用者;二是拟定专门著作权法案,界定人工智能的“独立智力创造标准”,以明确“机器作品”的著作权归属。欧盟是最早进行人工智能立法探讨的超国家组织。2017年,欧盟议会法律事务委员会提出系统立法方案,特别建议“对计算机或机器人创作的可确认著作权的作品”,需要制定相关“独立智力创造标准”,以便认定作品著作权归属。[61]
观察主要西方国家的立法动向,我们可以看出:有的国家(地区)持“理想主义”的立法立场。欧盟拟将最先进的自动化机器人身份定位为“电子人”,赋予其“特定”的权利和义务;同时考虑制定人工智能作品的独立创作标准,以解决该类作品的著作权问题。这一非常理想却尚未付之实践的立法方案,其要义是“人工智能具有独立的法律主体地位,创作的作品具有独立的著作权属性”。[62]有的国家持“实用主义”的立法立场。英国及其他遵循普通法传统的一些国家,灵活适用已有规定来解决“机器作品”权利归属问题,其立法成本较低且给司法裁判留下空间。所谓“必要安排”在法律条文中并无具体规定,往往由法官根据“实质性贡献原则”在具体判例中加以阐释。此外相映成趣的是:美国出于对人工智能技术应用的考虑,在合理使用方面采取灵活解读和广泛适用的宽松立场;但在“机器作品”版权属性方面,强调须有人类作者的介入和贡献,秉持一种保守主义态度。而欧盟出于对作者著作权保护的考量,对“文本数据挖掘”的例外条款,采取谨慎立法的政策选择;但在人工智能创作方面,其立法建议表现了一种理想”甚至“激进”的价值取向。
面对“机器作品”的出现,各国著作权立法总是呈现出一定的滞后性,而法律实践则更为活跃地走在前面。近年有些判例值得我们关注:①美国“猴子自拍案”。2011年,印尼原始森林中的一只猿猴使用英国摄影师David Stated的照相机自拍成照。之后,摄影师Slater声称自己对这些猴子自拍照享有版权,并向其他人发放版权许可。2015年,美国动物保护协会以猿猴的名义起诉摄影师David,称其侵犯了猴子Naruto的自拍照版权。美国联邦法院一审、二审均认为,根据现有法律规定,只有人类创作的作品才能授予版权。[63]2014年,美国版权局也修改了《版权局工作条例》,强调“对自然力、动物、植物产生的作品,没有任何创造性输入或没有人类作者的干预而通过自动或随机运作的机械方法产生的作品,版权局不予登记”,并将猴子自拍照作为不能受版权保护的例子予以列举。[64]现在的问题是:“算法创作”是否为机器自动生成而没有人类智力的实质性贡献?人工智能是否与猿猴一样不能成为适格主体?②中国“首例人工智能生成内容著作权案”。2018年,原告在一个法律数据库产品上,以“电影”为关键词对北京地区法院相关案件进行检索,该数据库系统自动生成了以图表数据为要素的分析报告,原告添加相应文字解释,形成涉案文章。法院认为,数据库软件自动生成的相关图形是基于数据差异产生而不是由于创作,因此不具有作品独创性特征;分析报告具有一定的独创性,但是根据现行法律规定,作品应由自然人创作完成,因此该报告不是著作权法意义上的作品。[65]此处带来的疑问是:人工智能图形生成与分析报告生成适用了相同的程序和算法,却得出独特性认定的背反结论。人工智能作品是否因类型不同而采用不同的独创性标准?是否因自然人权属主体不明而影响其著作权存在?
人工智能生成内容是“算法创作”的结果输出,关于其“可版权性”之证成或证伪的争论还在进行中,远未达成共识。这场21世纪“文学财产权论战”如同[18]世纪英国的“文学财产权论战”一样,[66]涉及到作品财产权正当性基础和合法性逻辑等重要命题,将会产生法律变革的世纪影响和世界意义。
四、结语:人工智能时代著作权法的价值取向
人工智能时代著作权法向何处去:是“非人类创作实体”的崛起,对“人类创作中心主义”带来法律挑战,还是作者与作品关系的疏离,从而出现“人类读者中心主义”的法律调整?上述问题可以概括为“后人类时代”著作权法价值取向的两个变化。
变化一:非人类创作群体即“机器作者”的出现,改变了人类智力创造的活动方式,甚至改变了人类对主体资格的独占局面。人工智能根据人类审美标准,创作出迎合人类需求的精神产品,已然在文学艺术领域被广泛应用,目前主要集中在音乐、电影、诗歌、绘画、摄影、图形设计以及新闻报道等方面。“算法创作”不仅拥有与人类创作相同的思想表达,而且具有高效、便捷的智能优势,因此存在着巨大的商业价值。毫无疑问,人工智能重现、延伸和拓展了人类的创作能力,“机器作者”与人类作者的合作、共存,使得“后人类时代”精神生产活动更加丰富多彩。承认非人类创作实体的意义,在于矫正“人类中心主义”的绝对思想和偏差行为,建立类人化创作与人类创作的“二元创作主体结构”。这一假定没有也不可能颠覆人类在智力创作领域中的中心地位。当然,我们应该看到“算法创作”的局限性和狭隘性:人工智能创作拘泥于人类精神生产活动的有限领域,数据偏差与算法偏见也会影响思想观点、价值标准和情感思维的表达,它们更多是电子流水线上的“生产者”“制作者”,而不是具有自由思想、独立人格的创作者。因此,我们可以对“人类创作中心主义”进行修正,但不能轻易做出绝对否认的结论。
变化二:“算法创作”通过分析用户数据,发现、引导和实现“机器作品”的消费需求,突出了用户即人类读者的中心地位。“机器作品”与人类作者关系的相对疏离,在文学艺术领域是“人类读者中心主义”的确立,在著作权法领域则是“人类作者中心主义”的式微。在人工智能创作活动中,人类读者的参与和介入有两个方面的意义:一是作为评价主体。“机器作品”的思想表现形式及其内在人格要求的辨识,来源于社会公众的评价。直言之,作品一旦公之于众,其意义解释和价值评判,就从作者那里转移到读者手中,机器作品概莫能外;二是作为作品“用户”。机器作品”的创意方向、创作方式、传播途径、市场效益等,无一不是用户数据分析的结果。“数据驱动创作”,在某种意义上是用户驱动“算法创作”。从“作者中心主义”向“读者中心主义”的转移,是“后人类时代”文学艺术创作活动的表征。正是在这个意义上,美国学者声称“读者的参与(即人类阅读)构成了著作权法的核心”。[67]我们必须调整作者与作品关系的认知,重视社会公众对作品特别是“机器作品”的评价与感受。但无须改变著作权法的基本价值取向和主要制度构成。具言之,保护作者专有权益,促进知识传播的立法宗旨,蕴含了对作品创作者、传播者、使用者三者利益平衡的理念;基于权利产生、客体、主体、内容、利用、保护而形成的制度框架,无疑是以创作者即第一著作权人为中心而设计的。我们可以对此修补和完善,但不要动摇著作权法的根基。
未来时代著作权法的走向,将是工具理性和价值理性的统一。人工智能的发展,应走出“技术知识的囚室”,[68]寻求具有广泛社会价值的技术理性;而著作权法的变革,应在法律制度重构中坚守立法目标,实现激励创新、规制风险的制度理性。人类技术理性与制度理性的结合,或许是对人工智能生成作品著作权法之问的最好回答。
(责任编辑:杨明)