当前位置: 中外法学 > 数据概念的解构与数据法律制度的构建
数据概念的解构与数据法律制度的构建
时建中,中国政法大学数据法治实验室{主任、教授}

一、数据概念的澄清:构建数据法律制度的逻辑前提与基础

2022年12月19日发布的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称为《意见》)提出,“构建适应数据特征、符合数字经济发展规律、保障国家数据安全、彰显创新引领的数据基础制度”。《意见》对数据基础制度的科学性提出了明确要求,指明了数据基础制度的目标和使命。数据基础制度事关国家发展和安全大局,同时也是数据法律制度的核心和主体。数据是构建数据法律制度的基础概念,制度实质上就是概念及其体系的逻辑及实践展开。然而,在理论和实践中,数据概念依然存在相当程度的混乱,这不仅影响学术研究和交流,而且制约了相关制度的构建。为此,本文尝试从多个维度解构数据概念,揭示数据的特征,并以此为基础对数据法律制度的构建进行研究。

(一)信息技术对信息载体的革命性创造——信息数据化、传输数字化

记录信息的能力是原始社会和先进社会的分界线之一。信息被传播、知悉和运用,需要借助载体予以传输。信息的载体形式及传输方式,实质性地影响着信息的传输质效。在一定意义上,人类社会发展史就是一部技术推动信息载体及传输方式进步的历史。

在纸张发明及广泛使用之前,书写介质因地取材、各具特色。早期图书馆的图书目录类似于财产登记簿,图书呈经台式地摆放在书桌上,且大部分图书都用铁链锁牵在书桌上。作为知识的载体,其应有的知识传播价值难以得到充分实现。简言之,在纸张发明以及广泛使用之前,书写的介质材料或者昂贵或者笨重或者不宜长期保存;在印刷术发明之前,图书均由手工抄写完成,数量极其有限。笨重且有限的书籍,加之落后的交通,知识和信息只能在少数贵族之间分享和传播。

纸张一经发明即成为人类社会最主要的信息载体,造纸术、印刷术以及以火车和铁路为代表的交通运输工具等诸多方面的进步带动着纸质图书、期刊、报纸等产业的发展和变革,推动着信息、知识的传播。但纸质信息的传播,受制于纸质信息载体的传输工具和方式、社会环境等诸多因素。以纸质信件为例,只有送达至收件人,信件信息才能被阅知。杜甫的诗句“烽火连三月,家书抵万金”,饱含着对家人的无限眷念,触动着历代游子心生共鸣。

电话和电报是人类社会的重要发明,加快了信息的传输。电话是传送与接收声音信息的远程通信设备,将人的声波转化为磁波,磁波再将其转化为电波,电波通过线路传送到接收端;接收端则在接收到电波之后将其还原为磁波,再将磁波还原为声波,从而听到对方的声音。电报则是用有线电、无线电或其他电磁系统传输书面信息的电信方式,主要有两种形式:其一是先将字符(字母、数字、标点等)编成电码,再按照电码发出电码信号,接收端将收到的电码信号译成字符,称为编码电报通信;其二是对文稿、照片等进行逐点扫描,形成信号并传输到对方,由接收端逐点复制出真迹,称为传真电报。

随着移动通信技术特别是5G以及大数据、云计算、区块链、物联网、人工智能等ICT技术不断进步,信息载体及传输方式均发生了革命性创新。与人类社会前几次技术驱动的工业革命相比,ICT技术的革命性特征和成果之一就是创造了全新的信息载体——电子数据。在不断进步的ICT技术推动下,数据呈几何级数增长,数据收集、传输和处理能力日新月异。蕴含着相关性的数据与数字技术相互促进,相得益彰。信息的传播必须依赖信息载体的传输,信息载体传输方式的进步推动着信息传播和分享。然而,在信息得以电子化记载、数字化传输之前,信息的有形载体及传输工具,例如,纸张、电话、电报等信息载体及其传输,纵然可以促进信息的传播,但是,无法嵌入并赋能生产过程进而成为生产要素。在数字化时代,广泛分布的传感设备收集着各种数据,庞大的网民群体和平台消费者群体不知疲倦地生产着数据,不断进步的数字技术和设备提升着数据存储能力和处理能力。作为新兴的信息载体,数据成为人类社会前所未有且取之不尽、用之不竭的新兴生产要素,赋能经济发展、社会进步、科技创新。

(二)数据与数字的概念辨析

概括地讲,数据是信息的载体,数字是数据的传输和处理方式。长期以来,通信信息传输信号一直是模拟信号(analogue signal),传输模拟数据。上世纪九十年代中期,通信信息传输信号革命性地创新为基于二进制编码的数字信号(digital signal),传输电子数据,开启了数字通信时代。相对于模拟信号,数字信号抗干扰能力强、保密性好、可靠性高,不仅可以保证传输质量,而且极大地提升了通讯的信息传输能力。随着移动通信网络技术的发展,数字通信持续地将电信业务拓展到兼容电话、电报、数据、图像、视频等多类信息的传输业务。电子计算机本来就是采用数字信号处理信息的。在电子计算机设备之间传输和处理信息,最合适的信息载体就是电子数据,传输和处理电子数据的最佳方式也是数字编码。这样,数字信号既支撑数字通信业务又支撑电子计算机处理信息,将数字通信与电子计算机连接了起来。数字通信的信息传输功能与电子计算机的信息处理功能聚合,释放出强大的信息记载、传输和处理能力。“随着信息技术进步及其产品和服务的推陈出新,信息技术产业融合将进一步加深,主要体现在终端产品的功能融合,即个人计算、通信、消费电子的融合;体现在运行平台上的服务融合,即通信服务、内容服务、计算服务等融合......”从信息通信技术(ICT)的层面分析,数据化,解决了信息的记载方式,实现了信息与电子数据的合一;数字化,解决了电子数据的传输及处理方式,跨智能设备之间传输和处理数据的速度、效率和质量得以持续提升。

包括数字经济、数字政府、数字社会在内的数字中国建设中的“数字”,其本意是充分运用ICT技术,处理数据信息和资源,提高经济效率、优化经济结构,推动优化和再造政府治理流程和模式从而不断提高决策科学性和服务效率,完善社会治理机制并精准提供社会服务。

无论作为信息载体还是生产要素,“数据”都是利益载体,具有重要的法律意义。作为法律概念,数据还衍生出体系化的数据权利、数据行为、数据利益或者数据权益以及数据法律关系等一系列法律或者法学概念,构成一个完整的概念体系,支撑数据制度体系和数据法学体系。然而,“数字”是一个技术术语,对规则的需求首先或者主要是技术标准及标准化法。

(三)数据资源化:从信息载体到生产要素

正如上文所述,ICT技术的革命性成果就是创造、开发和运用电子数据这一新兴信息载体,并使之成为人类社会前所未有且取之不尽、用之不竭的新兴生产要素。党的十九届四中全会指出:“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制。”将数据作为新兴生产要素,已经成为我国的政策选择。

1.数据要素化的原因:数据之间相关性的发现与运用

诗人泰戈尔写到:“天空不曾留下鸟的痕迹,但我已经飞过。”但如果没有相应的信息记录载体和记录能力,即使鸟儿飞过,又有什么证据证明呢?这样的冰冷分析,确实让诗句有点索然无味,然而,这的确表明,信息需要载体,没有载体就等同于没有信息。无论是《网络安全法》《数据安全法》抑或《个人信息保护法》以及《民法典》,均坚守了数据是信息载体这一科学认知,并将其内涵与外延法定化。作为信息载体,是数据的初始功能。被数据承载的信息,或许关于个人,或许关于企业,或许关于社会,或许关于国家。

随着数字技术蓬勃发展和广泛运用,数据量呈几何级数地增长,数据存储和计算的技术和能力突飞猛进,数据的价值开始衍变。承载信息的数据,作为要素融入并赋能生产、分配、流通、消费各经济环节,成为人类社会前所未有的新兴资源,提升着经济效率、优化着经济结构、驱动着经济创新发展。数据的要素化,源于数据之间的相关性。数据的相关性显性地表现为信息内容的相关,经深度挖掘和分析,可将相关性拓展到信息的内容与主体之间、信息的主体与主体之间。目前,数据相关性在经济发展、社会治理和政府管理的运用场景不断延伸。在经济领域,公众最为熟知的运用典范就是平台商业模式:基于不断优化的算法,精准发现并运用数据之间的相关性,匹配并满足各边的需求,形成各边互动的网络效应,成为平台经济模式搭建和发展的基础逻辑。

2.从信息载体到生产要素:数据制度目标的多元与统一

作为信息载体,维护数据安全是相关制度的优先目标。数据作为信息载体时,要适用有关个人信息、经营信息、政务信息的相关法律法规。我国相关法律对于个人信息中的私密信息、企业信息中的商业秘密和技术秘密、政务信息中的国家秘密,予以特别保护。信息需要载体。若无载体,信息就失去了得以存续和呈现的介质,等同于没有信息。因此,维护信息安全,就要保障信息载体安全。没有载体安全,就没有信息安全。例如,正是基于信息与载体不可分离的特性,我国《保守国家秘密法》第17条规定,“机关、单位对承载国家秘密的纸介质、光介质、电磁介质等载体(以下简称国家秘密载体)以及属于国家秘密的设备、产品,应当做出国家秘密标志”。在数字化时代,数据是信息的载体,维护信息安全,就要保护数据安全。没有数据安全,就没有信息安全。

作为生产要素,开发利用数据是相关制度的优先目标。数据作为新兴生产要素,是进一步数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。而且,只有作为生产要素并融入生产、分配、流通、消费各经济环节,数据才能发挥其独特的赋能作用。将数据存储在最安全的介质,放在保险柜,重兵值守,置于万无一失的状态,虽可提升安全程度,但数据只能止于信息载体,无法成为生产要素。作为生产要素,数据应该在更大范围、更大程度、更高质量、更高效率地得以开发和利用。

因此,如前文所述,作为信息载体,维护数据安全是优先目标;作为生产要素,开发利用数据是优先目标。两个“优先目标”虽不一致,但必须统一起来,安全是发展的前提,发展是安全的保障。维护数据安全,有利于保障数据开发利用的有序和效率;数据的开发利用,不仅推动经济发展,而且倒逼技术(包括安全技术)进步,持续提升维护数据安全的能力和水平。因此,统筹发展与安全是数据制度建设的基本指导思想。

党的十八大以来,我国更加高度重视数据安全制度建设。在总体国家安全观的指导下,统筹发展与安全,不仅将促进网络、数据和个人信息的合理开发利用写入相关安全法律的立法目标,而且搭建了维护网络与数据安全、保护个人信息与开发利用数据和个人信息的衔接机制。目前,与数据开发利用有机衔接的数据安全法治体系——以《国家安全法》为龙头,以《网络安全法》《数据安全法》和《个人信息保护法》为主体的数据安全制度体系基本建成。然而,促进数据开发利用的全国性法律制度亟待健全和完善。令人欣慰的是,《意见》提出的20条措施奠定了促进数据开发利用制度建设的政策基础。

(四)数据资源市场化是数据要素化的必然要求和必然结果

数据要素化就是数据融入并赋能生产、分配、流通、消费各经济环节的过程和结果,推动经济效率提升、结构优化、转型升级和提质增效。数据要素化离不开数据处理行为,包括数据的收集、存储、使用、加工、传输、提供、公开等。每一种数据处理行为,还包含着许多具体处理活动。以数据加工为例,至少包括数据的标注、清洗、脱敏、脱密、聚合、分析等提升数据质量的多个环节。数据必须经过处理,才能高质量赋能经济发展和社会治理。提升数据质量的每个处理环节和行为,凝聚了数据处理行为主体的投入,寄托了数据处理主体的正当的、合理的利益期待,应予以保护。

数据要素化的必然结果就是数据资源市场化和数据处理行为产业化。数据资源市场化,就是指通过市场机制配置数据资源,提高数据资源配置效率和质量。数据资源市场化,涵盖各种数据的各种状态,例如,个人数据和非个人数据、结构化数据和非结构化数据,等等;数据处理行为的产业化,就是推动数据的收集、存储、使用、加工、传输、提供、公开以及删除等数据处理行为的产业化。数据资源市场化和数据处理行为产业化,需要数据法律制度予以规范和引导,以进一步提高数据质量、提高数据要素的赋能质效。

作为资源的配置机制,市场即权益的合法交换机制,权益的界定和确认是市场交易的前提和基础。数据资源市场化是数据权益的市场交换,数据相关权益的界定和确认既是数据资源市场化的前提,又是数据法律制度的内核。建立健全数据要素的市场化配置机制,一方面,要充分发挥市场在数据资源配置中的决定性作用;另一方面,要更好发挥政府在数据要素收益分配中的引导调节作用,健全数据全流程监管规则体系,规范和引导数据处理行为,建立安全、公平、高效的数据要素流通、交易和收益分配制度,促进数字经济高质量发展。

二、数据资源的特征及数据权利化

(一)数据资源的特征

作为一种新兴生产要素,数据资源的特征,决定了数据权利化的特殊性和复杂性。数据权利化必须与数据的特征相符,且能最大程度发挥数据的资源价值。

1.数据的非竞争性

《经济学人》杂志曾将数据类比为新时代的“石油”。石油是一种竞争性资源,越用越少,并终将枯竭。作为一种新兴资源,数据则不同。随着数字技术的日新月异和广泛运用,数据越来越多。而且,与石油资源不同,数据资源有强大的再生能力,在使用过程中还会发现未曾发现的相关性。越使用,数据的再生能力就越强,数据之间的相关性会越多。数据相关性的发现、运用,决定了数据资源特有的经济价值、社会价值和管理价值。

2.可复制性

数字化时代,信息主要在网络环境基于数字技术并以电子形式生成和记载,亦即电子形式的数据越来越多。电子数据与有体物的一个重要区别,就是其可复制性。数据的可复制性,一方面有利于促进数据的开发利用,另一方面也加大了数据保护的难度。虽具可复制性,但是,电子数据不同于法律意义上的无形财产,与知识产权既有的客体亦不相同。

3.非排他性

数据的非排他性就是数据可以同时被众多主体控制、处理和利用,亦即数据被一个主体控制、处理和利用时,不妨碍其他主体同时控制、处理和利用该数据信息。数据的非竞争性、可复制性和非排他性,使数据具有公共物品的属性。通过技术、协议等手段排除限制其他主体使用数据,不仅降低数据资源的应然效率而且有可能违背公众的共同利益甚至公共利益。

综上,数据的非竞争性、可复制性和非排他性,决定了数据可以同时被多个主体控制、处理和利用。既然数据越来越多,越使用质量越高、再生能力越强、相关性越多,那么,从最大程度发挥数据要素价值的角度出发,应当通过数据权利制度,让数据可以被更多主体合法、合理地开发利用。所以,赋予数据主体对数据资源以绝对权,无疑不是符合数据特征的科学的制度安排。

(二)数据信息和数据资源的保护、开发与利用均离不开ICT技术

数据要素化的过程,就是数据的处理过程。数据要素赋能生产经营活动和数据处理均离不开ICT技术。未经ICT技术处理,数据至多止于信息载体,不具有生产要素属性和价值。任何数据处理行为和数据要素化的每一个环节,以及数据权益的保护和实现,都离不开ICT技术驱动下的数据接入(access to data)。因此,数据权利的配置必须尊重数据要素与ICT技术的不可分离的特征。

1.数据与移动通信技术

没有移动通信技术不断进步,特别是电信信号由模拟信号到数字信号的革命性创新,数据无法以数字编码和方式跨通信设备传输并被计算机处理,更遑论建设数字经济、数字政府和数字社会。基于大带宽、低时延、高速率的传输特性,5G融合应用已在工业、医疗、教育、交通等多个行业领域发挥赋能效应,覆盖国民经济40个大类。5G不仅带来更高速、优质的网络体验,也为数字经济发展修好桥、铺好路。实现人机物互联的网络基础设施,支撑数字经济、数字政府、数字社会的能力越来越强,数据呈现出爆炸式增长的态势。以数据流引领技术流、物质流、资金流、人才流,将深刻影响社会分工协作的组织模式,促进生产组织方式的集约和创新。只有基础电信业务发展和安全,才能奠定好网络与数据安全的底座。电信法对于构建网络综合治理体系具有重要作用,是解决网络和数据立法共性问题的重要基石,是支撑数字中国建设的基本法律,应当加快立法进程。

2.数据与大数据、云计算、区块链、物联网以及人工智能等数字技术

大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。没有数据就没有大数据,构成大数据的数据依然是信息载体。大数据则是由海量数据构成的基础性战略资源,是数据由信息载体演变为资源的过程和表现形式。大数据与数据具有不同的价值,大数据不能替代数据。由数据集合发展为信息技术的大数据,其核心价值是建立在相关关系分析法基础上的预测。事实上,随着数据分析技术的进步,数据间的相关性不需要到了大数据的程度才能被发现和运用。当然,数据量越大,可以被发现的相关性越多。同时,大数据是一种现代观念和意识——发现和利用数据的相关性。可见,大数据既是海量数据,又是数字技术,同时还是观念和思维方式。

云计算是推动信息技术能力实现按需供给、促进信息技术和数据资源充分利用的全新业态,是信息化发展的重大变革和必然趋势。云计算对数据资源的集聚作用,可实现数据资源的融合共享,推动大数据挖掘、分析、应用和服务。实施“上云用数赋智”行动,推动数据赋能全产业链协同转型。在数字化时代,算力作为关键的生产力要素,既是国民经济发展的重要基础,也是科技竞争的新焦点,已成为推动数字化发展的核心支撑力和驱动力。数据是云计算的技术标的,云计算是数据的处理行为和过程。规范和引导云计算的运用,同样需要数据法律制度为前提。

物联网即“万物相连的互联网”,是互联网基础上的延伸和扩展,将各种信息传感设备与网络结合起来,以感知技术和网络通信技术为主要手段,实现人、机、物的泛在连接,提供信息感知、信息传输、信息处理等服务的基础设施。随着经济社会数字化转型和智能升级步伐加快,物联网已经成为新型基础设施的重要组成部分。通过射频识别、红外感应器、全球定位系统、激光扫描器等信息传感设备,将用户端延伸和扩展到了任何物品与物品之间,并与互联网相连接,进行信息交换和通信,以实现对物品的智能化识别、定位、跟踪、监控和管理。“万物互联”是以万物数据化为前提和过程的,数据法律制度无疑是物联网法治化的内核。

区块链作为一项新兴技术,具有不可篡改、匿名性等特性,具有增强安全性、更大的透明度、即时可追溯性、提高效率和速度、自动化等优势,在供应链和食物链、银行业和保险等金融行业、医疗保健、医药、智慧政府等行业和领域具有广泛的运用前景。区块链技术生成的数据结构本身具有安全质量保障。基于密码学、去中心化和共识原则,可确保对交易的信任。在大多数区块链或分布式账本技术(DLT)中,数据被结构化为块,每个块都包含一笔交易或一组交易。每个新块都以加密链的形式与之前的所有块相连,几乎不可能被篡改。区块内的所有交易都通过共识机制进行验证和商定,确保每笔交易的真实性和正确性。区块链技术通过成员参与分布式网络来实现去中心化。没有单点故障,单个用户无法更改交易记录。区块链是一种不依赖第三方,通过自身分布式节点进行网络数据的存储、验证、传递和交流的一种技术方案,因此,区块链技术的运用质效,很大程度上依赖数据法律制度的健全与完善。

经过60多年的演进,特别是在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下,人工智能加速发展,呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等新特征。大数据驱动知识学习、跨媒体协同处理、人机协同增强智能、群体集成智能、自主智能系统成为人工智能的发展重点,受脑科学研究成果启发的类脑智能蓄势待发,芯片化硬件化平台化趋势更加明显,人工智能发展进入新阶段。我国人工智能技术快速发展、数据和算力资源日益丰富、应用场景不断拓展,为开展人工智能场景创新奠定了坚实基础。加速积累的技术能力与海量的数据资源、巨大的应用需求、开放的市场环境有机结合,形成了我国人工智能发展的独特优势。人工智能需要数据来建立其智能,特别是机器学习。人工智能应用的数据越多、质量越高,其获得的结果就越准确。

电信信号由模拟信号进步为数字信号,特别在是进展到5G之后,推动了ICT技术进一步发展和广泛运用。但是,若无数据,前述数字技术就像无米之巧妇,难以有所作为。数据与数字技术以及数字技术相互之间,关系密切并相互赋能。当然,数据的滥用及安全隐患,必然伴随着数字技术的滥用。数据与数字技术不可分离的特性,决定了数据法律制度的目标之一,就是规范和引导数字技术的运用行为,包括数据处理行为,保护数据内容相关主体和数据处理行为主体的正当利益,增强数据资源的开发利用质效。

3.数据与元宇宙

元宇宙在当下非常流行。有一种观点认为,元宇宙是在PC互联网和移动互联网之上更高维度的数字化空间。这个数字化空间的发展动力来源就是将云计算、分布式存储、物联网、VR(虚拟现实)、AR(增强现实)、5G、区块链、人工智能等前沿数字技术进行集成创新与融合应用。对于元宇宙的定义,学界和业界的争议较大。但是,若无数据则无元宇宙,这应当是没有争议的。

(三)数据与算法

从技术的角度讲,算法是一个有限长度的具体计算步骤,以清晰定位指令来使输入的数据经过连续的计算过程后产生一个输出结果。从功能角度讲,算法是发现数据之间相关性进而配置数据资源并实现数据价值的技术机制。作为数据相关性价值的发现机制、配置机制和实现机制,算法在数字经济运行过程中扮演着非常重要的作用。在数字化时代,任何一种数据处理行为都须借助算法。算法是数据处理的核心机制。例如,在数据的收集环节,收集什么数据、收集多大范围的数据、收集多少数据,均需基于算法实现。在收集数据的同时,需要通过算法确定存储数据的范围和方式,以实现数据数量、质量与存储成本之间的均衡。数据的收集和存储,解决了有没有数据的基础问题,数据的使用、加工才是实现数据价值的关键环节,解决为什么用数据、用什么数据、针对谁用以及怎么用等关键问题。离开了算法,就无法实现数据的价值;数据的传输、提供、公开,涉及数据的对内和对外分享,数据是竞争力的基础,算法成为了数据分享决策的必要机制。甚至,在数据处理行为监管不断加强的法治背景下,算法成为了探索法治边界、尝试规避法治的机制。因此,数据治理离不开治理算法和算法治理。

目前,算法存在以下突出问题:一是算法透明度不够,犹如黑箱。二是算法歧视,表现为算法不公平、不正义。三是信息“茧房”,表现为一些资本裹挟算法,向民众推送“选定信息”,迫使民众接收“茧房化”信息。四是诱导沉迷,例如,内容推荐算法在用户偏好、行为等数据的训练和强化下,不断优化推送用户感兴趣的内容,锁定用户注意力,导致用户沉迷甚至成瘾。五是算法剥削,例如一些平台企业运用算法来监视、操控劳动者,致使劳动力市场逐底竞争,造成低保障或无保障的“零工经济”泛滥,损害劳动者权益。六是算法违法,例如,通过算法实施违法的数据处理行为。这些问题滋生于两大根源:一是价值层面,算法运用者的商业伦理和价值观需要端正;二是数据与算法的监管制度供给不够、不优、不力。

笔者认为,算法公平的实现,不能寄希望于算法的公开和算法的可解释。这是因为:第一,对于是否公开,缺失必要的标准;第二,一旦涉及到企业的商业秘密或者技术秘密,算法有限度的公开不足以解释算法歧视;第三,算法是动态优化的,对算法的理解和解释,不应要求普通大众具有相应的必备知识和技能。因此,对于算法的监管和治理,应当确立结果导向的思维和机制。申言之,算法是否导致了不公平或者歧视,首先是事实问题,而不是法律问题。如果算法歧视属实,责任主体就应纠正算法意图实现的目标以及实现目标的参数。至于采取何种程序以及如何纠正,是算法责任者的法定义务,纠正的结果则又是事实问题。因此,如果作为证据,用于对算法的公平性予以验证,算法的备案等机制或许有一定的意义。在治理算法的过程中,监管机构可以作出责令纠正算法的决定并对责任者纠正算法的效果予以监督;责任者拒不纠正或者纠正未达预期效果的,监管机构有权采取强制审计、第三方代为纠正(代履行)、行政处罚或者行政强制等措施。

只有将作为治理对象的算法纳入法治轨道,公平、透明、非歧视的算法才能成为数据治理的强大武器,实现数据治理的目标,提升数据治理的能力,更好地推动产业数字化、数字产业化,赋能实体经济,更好地维护消费者利益。只有把算法关进法治的笼子,用法治化的算法发现数据之间相关性并配置数据资源、实现数据价值,数字经济才能够更加健康发展。

(四)数据及其相关概念的再澄清

对数据这一核心概念进行多维度的辨析,有助于深入推进数据法学研究,有助于促进数据法律制度构建及其实施。我国《数据安全法》提及到的数据相关概念,不仅包括政务数据、涉及个人信息的数据、军事数据等侧重数据内容的类别,而且包括诸如重要数据、核心数据等侧重分级管理的数据类别。我国《个人信息保护法》提及到了敏感个人信息、未成年人个人信息等个人信息类别。面对这些相关概念,一个普遍的困惑和问题是:一方面,前述法律并未对其法定的分类数据概念予以必要界定;另一方面,近几年中央和地方层面的立法及规范性文件中,又创设了一些前述法律没有规定的概念。概念是制度生成的基础,概念不清、逻辑关系混乱,必然带来制度设计和实践中的问题。以下对数据相关类型概念展开简要分析。

1.政府数据、政务数据、公共数据与社会数据

政务数据是非常重要的数据资源,推进政务数据共享和开放,是数据基础制度建设的重要内容。值得注意的是,《数据安全法》使用了“政务数据”这一概念,我国《国民经济和社会发展第十四个五年规划和2035年远景目标纲要》则使用了“政府数据”和“公共数据”,没有使用“政务数据”,并且提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”。《国务院关于加强数字政府建设的指导意见》(以下简称《指导意见》)同时使用了“政务数据”“公共数据”和“社会数据”,没有使用“政府数据”。对于这三类数据,提出了“加强对政务数据、公共数据和社会数据的统筹管理,全面提升数据共享服务、资源汇聚、安全保障等一体化水平”。针对政务数据,提出:

  加强数据治理和全生命周期质量管理,确保政务数据真实、准确、完整。建立健全数据质量管理机制,完善数据治理标准规范,制定数据分类分级标准,提升数据治理水平和管理能力......充分发挥政务数据共享协调机制作用,提升数据共享统筹协调力度和服务管理水平。建立全国标准统一、动态管理的政务数据目录,实行“一数一源一标准”,实现数据资源清单化管理......以应用场景为牵引,建立健全政务数据供需对接机制,推动数据精准高效共享,大力提升数据共享的实效性。

针对公共数据,《指导意见》提出“编制公共数据开放目录及相关责任清单,构建统一规范、互联互通、安全可控的国家公共数据开放平台,分类分级开放公共数据,有序推动公共数据资源开发利用,提升各行业各领域运用公共数据推动经济社会发展的能力”。对于社会数据,《指导意见》提出“推进社会数据‘统采共用’,实现数据跨地区、跨部门、跨层级共享共用,提升数据资源使用效益”。对于公共数据和社会数据,提出“推进公共数据、社会数据融合应用,促进数据流通利用”。

关于公共数据的含义和外延,虽然《意见》并未定义,但其中“对各级党政机关、企事业单位依法履职或提供公共服务过程中产生的公共数据”的表述,明确了公共数据的来源和构成;在地方立法文件中,公共数据的来源与构成与《意见》基本类同。至于何谓“社会数据”?则只能意会而无法言传,我们不知道对其进行定义的维度、不知道其外延范围、不知道其包括哪些控制或者处理主体。

2.公共数据、企业数据、个人数据

类似的概念不清和逻辑不明问题,也存在于“公共数据”“企业数据”和“个人数据”这三个概念中。若单独看,每个概念或许均可自洽;但是,将这三个概念中的任何两个概念并用,都会出现某种紊乱。

例如,个人数据是企业数据、政府数据或者政务数据以及公共数据、社会数据的来源和基础。在既有的政策文件中,个人数据多指关于个人的数据。然而,个人数据被持有状态非常多样、复杂,不仅被该个人持有,而且可能被其他个人、企业或者政务部门同时持有。不容忽视的是,个人控制或者处理的数据,并不限于该个人的数据,个人也可能会控制或者处理有关其他个人、企业或者政务部门的数据;“政府数据”“政务数据”,多指政府机构、政务部门“控制或者处理”的数据,有时还包括关于该政务机构及其事务的数据,个人数据、企业数据甚至社会数据囊括其中,构成公共数据的来源和基础;“企业数据”,有时指关于企业的数据,有时指企业控制或者处理的数据,这两种含义单独使用和合并使用的情形,均有之。

由于分类的标准未能坚持同一性,导致概念的定义维度不同,故概念之间存在内涵不清、外延错乱、关系不顺等问题,这加大了科学配置数据权利与义务的难度。尽管如此,鉴于数据的特征及其兼具信息载体和生产要素的双重属性,对数据作“关于”类和“控制或者处理”类的区分,更具有科学性。具体来讲,“关于”类的数据,侧重主体与数据所承载的信息内容的相关性;“控制或者处理”类的数据,侧重主体与数据处理行为的相关性。把这一分类方法和标准统一地、同一地适用于所有数据,对于深入解构数据概念、数据利益乃至数据权利和义务,都是有价值的。上文提及的若干问题,不是分类方法和标准造成的,而是分类标准未能坚持同一性而造成的。

3.结构化、半结构化和非结构化数据

数据包括结构化、半结构化和非结构化数据等类型。数据由非结构化到半结构化乃至到结构化,是数据加工的过程和结果。数据的结构化处理,需要付出必要成本,例如数据收集或者受让成本、数据结构化处理成本等投入。既然有投入,自然期待利益回报。正当的期待利益应受到法律保护。需要特别指出的是,结构化的数据若表现为数据库,则可以给予相应的知识产权保护。

4.数据与数字;数据化与数字化

在当前的学理研究中,“数据”与“数字”;“数据化”与“数字化”的混淆也具有一定的普遍性。

信息需要传输,不同的信息载体需要不同的传输形式。在数字化时代,将数字技术广泛应用于经济发展、社会治理、政府管理、科技进步,提高决策水平、服务效率、发展质量,源于信息载体和传输方式的革命性创新与互动,被传输的数据信息数量、质量和效率不断迭代超越。数字化时代,传输是计算机网络以数字编码的方式,在不同的通信设备之间交换电子数据的过程。数据是信息的载体,数字是传输信息的方式。在不同的智能终端之间,“信息”是被传输的对象,“数据”是被传输的载体,“数字”是传输的形式。在传输的过程中,“信息”“数据”和“数字”三者虽然合一,但并非同一事物,不能混用。而且,三者的制度需求也有差异。

与“数据”和“数字”相关的另外一组概念是“数据化”和“数字化”。数据化意味着我们要从一切太阳底下的事物中汲取信息,甚至包括很多我们以前认为和“信息”根本搭不上边的事情。数字化是指一种把现象转变为可制表分析的量化形式的过程。数据化和数字化大相径庭。数字化将模拟数据转换成用0和1表示的二进制码,从而计算机可以读取的数字数据,使得存储和处理这些数据变得既便宜又容易,从而大大提高了数据管理效率。数字化带来了数据化,但是数字化无法取代数据化。数字化和数据化有本质的不同。如果说数据化是一种认识世界和改造世界的范式,或者说是一种认识问题和解决问题的范式,那么,数字化就是支撑数据化的一套技术规程。数字化的目的和效果应该是激活数据要素潜能,整体驱动生产方式、生活方式和治理方式变革,加快建设数字经济、数字社会、数字政府。

5.数据与数据产品

与数据相关的一个重要概念是数据产品或服务。数据产品是数据加工的结果。数据产品虽然由数据构成,但是不同于作为加工材料的数据。对于数据产品,有了运用绝对权予以保护的必要和可能。例如,数据库是一种数据产品,可以通过知识产权予以保护。但是,对于数据产品给予的绝对权保护,并不必应当回溯至作为数据产品加工材料或作为必要构成的数据。

(五)影响数据资源权利化的主要因素

数据的前述特征及其叠加,使得数据资源的权利安排具有了特殊性,展开分析如下。

1.数据的非竞争性、可复制性和非排他性,决定了不应对数据作绝对权的安排,而应通过数据权利制度安排,让数据可以被更多主体合法地持有、加工、利用,以利于数据资源在更大范围、更大程度发挥数据要素价值,促进数据资源更高质量、更高效率的开发利用。

2.数据与数字技术不可分离的特性,注定了数据权利的行使、数据利益的实现和保护、数据义务和责任的承担一定与数字技术行为相结合。然而,这并不意味着可以混淆数据与数字、数据与数字技术以及数据法治与数字技术法治,三者及其制度需求均高度关联,但差异显著。数据与数字技术的不可分离的特性,决定了以“数据”为核心概念、以数据法律制度为主要研究对象的数据法学是一个新兴交叉学科,涉及到法学与数字技术的跨学科交叉研究,以生成相对独立的知识体系和学科体系,并引领传统法学学科的升级。当然,数据法学研究还需要进行法学与经济学、管理学等学科的交叉研究。尽管数据法学涉及到法学与数字技术的跨学科交叉研究,但是,不能把数字技术立法等同于数据立法。为了推进数字技术的研发与运用,这是科技法学应该在数字时代承担的与时俱进的使命;由于数据及数据处理行为与数字技术的运用不可分离,为了规范数据处理行为,特别是为了预防和制止滥用数字技术处理数据的行为,数据法学责无旁贷,应为相关制度的构建贡献智慧和方案。

3.数据的双重属性——既是信息载体又是生产要素,注定了无论任何形式、任何状态的数据,作为信息载体,与信息不可分离;作为资源,又可超越信息。数据对信息的超越,可能源于如下几种情形:第一,基于法律的规定。例如,依据《个人信息保护法》第4条规定,个人信息不包括匿名化处理后的信息,实质性将“匿名化处理后的信息”排除在个人信息之外。在继续承载“匿名化处理后的信息”的同时,数据与个人信息实现分离,既未弱化对个人信息的保护,又为数据资源的有效开发运用提供了合理的法治空间;第二,基于隐私技术的进步。不断进步的隐私保护技术,例如隐私计算或者联邦学习,提供了数据可用不可见的技术方案甚至设施,实现了数据对信息的超越,有效地化解着信息安全保护与数据开发利用之间的冲突;第三,基于常态化法律实施产生的威慑力。企业会更加主动强化合规并通过技术措施在开发利用数据资源的同时,加强保护个人信息、维护数据安全。数据权利的配置,必须统筹信息安全与资源利用。数字化时代,信息安全依赖数据安全,没有数据安全就没有信息安全。同时,作为信息载体,数据基于在聚集到一定数量规模之后蕴含的相关性,与生产经营活动相融合,超越了信息载体的功能,成为生产要素。这就要求一方面关注数据安全,另一方面要促进数据的开发利用。因此,数据的权利安排,要区分作为信息载体的数据与作为生产要素的数据。

三、数据法律制度的构建

上文已述及,与数据开发利用有机衔接的数据安全法治体系基本建成。这几部法律有一个共同的特点,均在立法目标中贯彻着发展与安全并重的指导思想。以我国《数据安全法》为例,第1条规定了“保障数据安全,促进数据开发利用”相关内容,充分体现了统筹发展与安全的指导思想。保护数据安全,就是采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。数据安全法应贯彻到数据的收集、存储、使用、加工、传输、提供、公开以及删除等全部处理活动和过程。数据安全,既包括静态的信息安全和数据资源安全,又涵盖数据价值链和产业链安全。这就需要通过保护数据相关主体的正当权益,持续提升数据相关主体维护数据安全的自觉性和积极性,促使数据相关主体不断加强安全能力建设。因此,需要在数据安全立法总体框架基本成形的基础上,加快保护数据利益的立法,构建数据权属体系和数据行为规则体系,促进数据开发利用的全国性法律制度,强化和提升保护数据安全的自觉性。我们注意到,《数据安全法》还在第13条规定,“国家统筹发展和安全,坚持以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展”,为制定实现立法目标的具体制度,做出了原则规定。

(一)数据利益与数据利益相关者:数据法律制度的基础概念

作为信息载体的数据,一旦要素化和市场化,就由信息利益载体衍生为资源利益载体。数据种类、状态、行为的多样性和复杂性,决定了数据赋权的复杂性。因此,构建以数据权属体系为核心的数据法律制度,必须关注不同数据利益主体的正当数据利益。基于数据资源的价值基础和增值过程,笔者认为,数据利益可以解构为数据内容相关利益和数据行为相关利益。相应地,数据利益相关者,包括数据内容利益相关者和数据行为利益相关者两大类数据主体。

数据内容利益相关者主要解决“关于谁的数据”这一问题,即与数据内容相关的数据利益相关者,包括自然人、法人和其他非法人组织。与之对应,可以将数据分为关于自然人的数据、关于法人的数据、关于非法人组织的数据,等等。基于自然人、法人和非法人组织的分类,与内容相关的数据利益相关者还可以继续作更为深入细致的分类。例如,关于自然人的数据,还可以分为身份数据、行为数据、关系数据等等;关于法人和非法人数据,还可以分为诸如组织状态数据、产品或者服务的生产经营数据等等。数据行为利益相关者主要解决“数据怎么处理以及由谁处理”这一问题,即与数据行为相关的数据利益相关者,根据《数据安全法》和《个人信息保护法》有关数据处理和个人信息处理相关规定,包括数据收集行为及收集者、数据存储行为及存储者、数据加工行为及加工者、数据使用行为及使用者、数据传输行为及传输者、数据提供行为及提供者、数据公开行为及公开者、以及数据删除行为及删除者,等等。

鉴于数据作为信息载体和资源的双重属性,数据内容相关利益亦是双重的,即信息相关的利益和资源相关的利益。对于信息相关的数据利益,诸如基于个人信息、企业的商业和技术信息、国家的保密信息,可以寻求不同的法律予以保护,例如《个人信息保护法》《反不正当竞争法》《保密法》等等。资源相关的数据利益,源于但不同于信息相关利益。数据行为相关利益,源于数据因处理而增质和增值,简而言之,数据因收集而获得且不致于流失并得以保存;数据因存储而汇聚为资源;数据因加工而成为生产要素;数据因传输而弘扬其非竞争性、可复制性、非排他性等资源特征;数据因公开而赋能更多运用场景;数据因使用而彰显其独特的要素价值。数据处理是数据要素化、资源化、市场化的前提,数据的合法处理者当然应享有正当的数据利益。

“耶林通过使人们注意权利背后的利益,而改变了整个的权利理论。他说权利就是由受到法律保护的一种利益。所有的利益并不都是权利。只有为法律所承认和保障的利益才是权利。”“所以,我们必须从法律并不创造这些利益这一命题出发。法律发现这些利益迫切要求获得保障。它就把它们加以分类并或多或少地加以承认。”数据权利的配置,实质上是对正当数据利益给予承认和保护。对数据利益相关各方正当利益的保护,既是促进数据开发利用的保障机制,又是提升数据安全自觉性的激励机制。数据涉及到的利益主体非常多,在数据权利安排过程中,必须要全面兼顾不同的数据利益相关者的正当利益,数据的权利体系才是正义的、公平的和有效率的。这应该是“建立健全数据要素各参与方合法权益保护制度”的要义。

(二)数据权利

随着数字经济的发展,数据权属问题越来越成为一个真问题。数据权利配置的复杂性和难度源于数据种类及其被持有、被处理的事实状态的复杂性。以利益为内核的权利,不仅决定着行为的起点,而且决定着行为的边界。构建数据权利体系的目的是为了建立数据行为的边界,明确数据行为所引起的法律关系的内容。数据权利应由全国性立法予以规定。

1.数据权利不同于数字权利

不无遗憾地讲,国内法学界存在将“数据权利”与“数字权利”混为一谈的现象。事实上,在英文文献中,“数字权利”(digital right)与“数据权利”(data right)有着明显的差异。数字权利是指人们能够自由和开放地获取信息和通信技术(ICT)的权利,例如,访问、使用、创建和发布数字媒体,以及访问和使用计算机、其他电子设备和通信网络的权利。在数字化时代,基本权利不仅不应受到数字技术的消极影响,而且应当受到积极保护。数字化时代的网络隐私权和言论自由权,是典型的数字人权,是联合国《世界人权宣言》规定的相关权利在数字化时代的延伸。数字权利强调个人基本权利,强调基本权利不受数字技术的消极影响,既包括使用数字技术的能力,也包括获取信息的权利。数字权利应该是宪法权利。数据权利则是与数据信息和数据资源有关的权利。数字权利与数据权利密切相关,但不可混为一谈。

2.数据与所有权逻辑具有内在冲突

前文已述及,基于数据的特征,对数据不能作类似有体物那样的所有权安排。所有权的对世权特性不利于数据的开发利用,即使赋予数据主体以所有权,所有权主体也不可能排他地行使占有权。例如,只要使用互联网,个人信息和数据便可能会因法律规定或者因合同约定而同时被其他主体所“占有”;本应排他的占有权若被侵害,要么无法予以救济,要么救济成本太高。一个无法被救济的权利或者救济成本高到无法救济的权利,本身可能就不应被法律安排为权利。所以,所有权的安排并不能有效保护数据相关主体的正当利益。2018年10月,英国科学院、英国皇家学会等机构在专门就数据所有权、权利和控制的研讨中确定了若干要点,其中包括,“‘数据所有权’一词的使用带来了巨大的挑战,并可能不合适,因为数据不像财产和其他可以拥有或交换的物品;相反,讨论应该探讨个人、团体和组织对数据的权利和控制”,“无论是普通法系还是大陆法系,数据所有权的概念都缺乏法律依据”,会议还前瞻性地指出,“个人数据是一个动态概念。今天不属于个人数据的数据可能在不久的将来被认为是个人数据。随着技术的进步,在某些情况下,甚至机器生成的数据也可以被视为个人数据”。德国学者的主流观点,同样是不承认、不建议德国民法典所有权制度可以适用于数据。

同时,对数据作所有权的法律制度安排,还必须考虑数据种类及控制状态的复杂性以及所有权协议安排的荒谬性。以个人数据为例,即使不考虑个人控制或者持有的数据这一可能的含义,仅仅将其含义限定为关于个人的数据,个人数据被控制或者持有的状态非常多样和复杂。如果将个人控制或者持有的数据这一含义也考虑进来,那么,数据被控制或者持有的状态更加多样和复杂。再如,有些平台为了获取可以强化其商业模式竞争力的数据,鼓励用户将其拍摄的涉及他人经营服务场所甚至经营服务内容的照片上传至平台,并且通过用户协议等格式条款约定拍摄者所上传的照片等数据的所有权归属平台。无疑,这是一份涉及第三人的协议。如果承认这样的用户协议合法有效,那么,对于第三人数据及利益如何保护?对数据权利的安排,不仅要考虑拍摄者即数据采集者及上传者的利益,而且要考虑被拍摄者的包括数据利益在内的正当权益。在数据权利法定化不足的背景下,合同当事人通过合同对数据及利益进行约定,固然是非常现实的安排。但是,合同当事人可以针对哪些数据以及哪些数据的哪些处理行为约定哪些权利,或者说,哪些数据的哪些处理行为的权利义务可以通过合同约定,特别是涉及第三人的数据权益时,是一个值得讨论的话题。

3.数据权利是非排他的权利

受制于数据资源非竞争性、可复制性、非排他性等特征,数据权利的非排他性安排有助于发挥数据资源的赋能价值。同时,在现代社会,数据常态化地同时被多个主体交织地持有。例如,我们的个人数据同时被街道派出所、银行、医院、电子商务平台等机构持有,个人也持有着其他个人和机构的相关数据。数据持有状态的多样性和复杂性,决定了不宜用绝对权粗暴地处理复杂的数据利益关系。对于依法收集或者受让而获得的数据,有权持有,持有的状态受到法律保护,但不能排除他人同时持有相同的数据;对于合法持有的数据,有权开发加工或者委托开发加工,有权使用或者授权他人使用,但不能排除他人开发加工或者委托开发加工其合法持有相同的数据,不能排除他人使用或者授权他人使用合法持有的相同的数据;对于依法加工或者委托加工的数据产品,有权转让,但不能排除他人转让依法加工或者委托加工的相同的数据产品。

4.数据接入是数据权利的基本权能

数据资源权利化必须考虑数据资源与技术不可分离且相互促进的特征。数据资源要素化以接入数据为前提。数据资源要素化的过程,就是数据的处理过程。数据赋能生产经营活动离不开技术。未经技术处理,数据至多止于信息载体,不具有资源属性和价值。任何数据处理活动,任何数据权利的行使和数据权益的保护,都离不开数据的接入(access to data)。因此,数据接入是数据权利的基本权能,是行使数据权利的前提。

(三)数据行为

数据行为,亦可称之为数据处理或者数据处理行为,包括数据的收集、存储、使用、加工、传输、提供、公开以及删除等,是发现并实现数据要素价值的技术活动过程,是引发数据法律关系产生、变更和终止的法律事实。数据行为规则是搭建数据法律关系的法律基础,是数据社会关系法治化的基本依据。数据行为规则的构建,必须尊重数据及数据行为的固有特征。

1.数据行为的独立性、复合性与技术性并存

每一种数据行为,包括数据的收集、存储、使用、加工、传输、提供、公开以及删除等,都是独立的。虽然如此,不同的数据行为是可以并存的。甚至,不同数据行为并存乃至耦合在一起,不仅在技术上可行,而且在经济上更加富有效率。例如,云计算集成了数据存储、存储、使用、加工、传输、提供等众多数据处理服务,具有综合性和复合性的特点。数据处理服务的规模和范围效应,可以降低数据行为复合性的成本,提高复合性的效率。数据与数字技术的不可分离的特征,决定了数据行为与数字技术同样具有不可分离甚至合一的特征。数据行为规则必须兼顾数据行为复合性、产业化以及技术性等特点。

2.数据要素化与数据行为产业化

从数据赋能的机理分析,数据处理是数据要素化的前提和过程。没有数据处理行为,就不可能实现数据的要素化。换言之,数据要素化与数据处理行为是同步的。随着数据要素化和市场化,数据处理行为,例如,数据的收集、存储、使用、加工、传输、提供、公开等,均呈现出专门化、产业化的发展态势。数据处理行为的产业化发展,推动了数据产业自身的市场化进程。数据处理行为的产业化和市场化,一方面,加剧了产业的竞争,提出了规范发展的法治需求;另一方面,也促进了产业的创新发展,进一步推动了数据价值的深度挖掘。

3.数据要素市场化强化了数据行为主体的利益诉求

数据要素赋能质效要取决于数据规模和质量。数据要素市场化就是通过市场配置的激励机制,提高数据规模和数据质量。数据要素市场化必然推动数据处理服务的专门化、产业化。数据要素的市场化,本质上就是数据相关利益的市场交易。承认并保护数据行为主体的正当利益诉求,可以提高数据处理质量,可以提高数据要素及市场化的质量。数据要素化和市场化,对数据权利及其制度体系的建立和完善提出了更加强烈的需求。在数据处理的不同环节、数据被处理的不同状态,数据行为主体都会提出不同的数据利益诉求,应辅之以不同的权利安排。从法律上讲,交易的本质就是权利义务的合同安排。就数据交易而言,在数据处理活动的任何一个环节,以及任何一个环节的任何数据成果,都可以进行数据交易或者成为数据交易的标的。为此,我国《数据安全法》第19条规定,“国家建立健全数据交易管理制度,规范数据交易行为,培育数据交易市场”。引入市场机制强化数据行为主体的利益诉求,有助于充分发挥海量数据和丰富应用场景优势,利用数据资源推动研发、生产、流通、服务、消费全价值链协同,探索建立与数据要素价值和贡献相适应的收入分配机制,激发市场主体创新活力。促进数字技术和实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,不断做强做优做大我国数字经济。

(四)数据权利、义务及责任的配置:数据法律关系的构造

数据法律制度构建有必要引入法律关系的范式。在不同的数据关系主体之间科学配置权利、义务和责任,是分析处理数据法律问题的基本方式,也是数据法律制度的应有之义。我国《数据安全法》列举了7种数据处理行为,即收集、存储、加工、使用、加工、传输、提供、公开等。在此基础上,《个人信息保护法》增列了“删除”,即“7加1”种个人信息处理行为。每一种数据处理行为都能引发数据社会关系的产生变更或者消灭。数据社会关系的法治化,是数字中国与法治中国相统一的内在要求。因此,需要在不同的数据行为主体之间科学地配置相应的权利、义务和责任,建构相应的数据法律关系。配置权利、义务和责任,既要解构数据行为引发的数据社会关系,又要结合具体应用场景,还要恪守数据及数据行为的特征以及属性。

(五)加快全国性的数据法律制度供给

1.建设数据市场和发展数字经济,需要坚持全国统一开放竞争有序的原则

为了发挥数据和数字技术的牵引和赋能作用,提高数据开发利用的规范化程度,地方立法积极性甚高。目前已有28个省出台了与数据相关的地方立法或者规范性文件,呈现出地方包围中央的态势。地方对数据立法的普遍需求,证明了全国性立法的必要性、迫切性和可行性。数字经济无疑更应该是全国统一开放、竞争有序的经济活动。地方立法或许可以提高行政区划内数据开发利用的规范化程度,然而,不一定有助于形成全国统一开放竞争有序的数据市场和数字经济,难以保障市场机制在全国范围配置数据资源的决定性作用。甚至,地方立法的某些差异化制度安排,恰恰会制约全国统一数字经济的有效形成和健康发展。全国性制度的长期缺失,地方立法的刚性增强,数字经济有可能被封闭、分割和竞争失序。

2.公共数据授权运营应该引入竞争机制,严防公共数据的垄断运营

为开发和利用公共数据资源,推动数字经济建设,一些省级地方立法探索建立公共数据授权运营机制。前述《意见》也提出,“推进实施公共数据确权授权机制,对各级党政机关、企事业单位依法履职或提供公共服务过程中产生的公共数据,加强汇聚共享和开放开发,强化统筹授权使用和管理,推进互联互通,打破‘数据孤岛’......推动用于公共治理、公益事业的公共数据有条件无偿使用,探索用于产业发展、行业发展的公共数据有条件有偿使用”。《意见》为公共数据授权运营提出了原则举措,尚需转化为具体的制度安排,还有许多值得关注的问题:公共数据最大程度开放与个人数据最小必要收集的矛盾怎么化解?“推动用于公共治理、公益事业的公共数据有条件无偿使用”的确切含义为何?例如,如何界定“用于公共治理、公益事业”?有权无偿使用的数据范围?主体范围?需要哪些条件和哪些程序?“探索用于产业发展、行业发展的公共数据有条件有偿使用”的确切含义为何?如何界定“用于产业发展、行业发展”并与“用于公共治理、公益事业”相区别?有偿使用公共数据的收费标准及确定机制?在公共数据必然包括个人数据的情况下,公众可以免费获取哪些基本数据服务?尤为重要的是,公共数据授权运营是否应该采取独家模式?如何防止公共数据授权经营成为制约公共数据开放的瓶颈?如何防止公共数据授权运营机构成为妨碍数字经济建设的数据服务垄断者?公共数据资源的内容提供者和数据行为处理者的正当利益如何得到保障?笔者认为,为了有效遏制公共数据授权运营过程中不合理的做法,必须坚持公共数据是数字化时代公共产品的属性,坚持公共数据“取之于民、用之于民”的基本原则,构建科学合理的公共数据控制者、处理者和运营者的义务规则体系。公共数据控制者、处理者和运营者有义务持续地、高质量地向公众提供基于公共数据的免费基本数据服务;不提供免费基本数据服务者,不得提供基于公共数据的收费数据服务;基于数据具有非竞争性、可复制性和非排他性的特征,公共数据的处理和运营,应当引入竞争机制,杜绝公共数据独家授权运营,谨防公共数据授权运营机制被运营机构“绑架”或者“钓鱼”的风险。对于公共数据授权运营中可能发生的行政性垄断和腐败问题,要依法予以预防和制止;对于地方有关公共数据授权运营机制的制度安排,要强化公平竞争审查和反垄断执法,防止公共数据授权运营演变为数据资源地方保护、垄断经营、索取不公平高价。

3.企业数据的开发和利用需要规范和引导

首先,需要依照《意见》推动建立企业数据确权机制,对各类市场主体在生产经营活动中采集加工的不涉及个人信息和公共利益的数据,市场主体享有依法依规持有、使用、获取收益的权益,保障其投入的劳动和其他要素贡献获得合理回报,加强数据要素供给激励。其次,需要依法处理企业数据与个人数据的关系,依法保护个人信息。个人数据是企业数据的重要来源和基础。企业数据既然取之于消费者,就不应精准地用于“反杀”消费者、侵害消费者利益或者隐私权,这应该是企业数据利用的商业伦理底线。再次,根据《反垄断法》规定,企业不得利用数据和算法、技术、资本优势以及平台规则等从事该法禁止的垄断行为。事实上,规范和引导企业数据的开发和利用,不仅需要禁止性规范,而且需要授权性规范:承认并保护企业的正当数据利益,允许企业通过市场配置数据资源、交换数据利益,推动企业数据和数据产品的开放和共享,应该是一个基本原则。

总之,正确认识理解数据概念及其特征,是构建数据法律制度的前提。数据法律制度的科学构建,需要尊重数字经济发展规律、ICT技术创新驱动规律、社会进步规律和法治规律。承认并保护不同类别的正当数据利益,加快以数据权属体系为核心、以数据行为规则体系为主体的全国性数据法律制度,才能保障数据价值链、产业链的发展与安全,做强做优做大我国数字经济,护航国家发展和安全大局。

(责任编辑:王锡锌)

【注释】

       [1]参见《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》,载中国政府网,http://www.gov.cn/zhengce/2022-12/19/content_5732695.htm,最后访问日期:2022年12月19日。

  [2]尽管我国《数据安全法》第3条规定,“本法所称数据,是指任何以电子或者其他方式对信息的记录”。但是,本文所研究的“数据”主要限于以电子方式对信息的记录,即电子数据。若无特别提及或者说明,本文中的“数据”即“电子数据”。

  [3]参见(英)维克托·迈尔·舍恩伯格、肯尼斯·库克耶:《大数据时代:生活、工作与思维的大变革》,周涛等译,浙江人民出版社2013年版,第105页。

  [4]参见时建中、刘鸿霞等主编:《中国政法大学图书馆资源与服务报告(2017)》,中国政法大学出版社2018年版,第1页。

  [5]18世纪中期,以蒸汽机为代表的第一次工业革命开创了人类的大机器工业时代;19世纪后期到20世纪中叶,以电机为代表的第二次工业革命使人类进入了电气化时代;20世纪下半叶,以互联网计算机为代表的第三次工业革命迅速席卷全球,使人类社会生产方式从以工业化为主导向信息化与工业化融合转变,劳动生产率得到了极大提高,社会生产力和人类文明达到了前所未有的新高度,世界正在进入信息化时代。参见江泽民:“新时期我国信息技术产业的发展”,《上海交通大学学报》2008年第10期,第1590页。

  [6]一般认为,数字通信的开启,以第二代移动通信技术(2G)商用为标志。2G有GSM和CDMA两种技术标准。1991年和1993年,欧洲和美国分别开始商用GSM和CDMA。1993年9月19日,我国第一个数字移动通信网(GSM)在浙江省嘉兴市正式向公众开放,包括1个交换中心和6个基站,服务范围覆盖全市五县(市)两区,数字移动电话交换机最终容量为10万户。这是我国建立和开通的第一个GSM系统,在我国电信通讯史上具有里程碑意义。在部署2G移动通信时,选择欧洲的GSM还是美国的CDMA,有技术、市场、经济、政治等复杂考量。在嘉兴试点验证基础上,1994年10月,我国第一个省级数字移动通信网(GSM)在广东省开通,容量为5万门。

  [7]早在1623年,德国科学家契克卡德(W.Schickard)制造了人类第一台机械计算机,这台机器能够进行六位数的加减乘除运算。机械计算机由杠杆、齿轮等机械部件而非电子部件构成。机械计算机使用的不是二进制,而是十进制等更接近人类的日常计算思维方式。机械计算机在第二次世界大战达到使用高峰。20世纪六十年代中期,随着性能强大的电子计算机广泛使用,机械计算机逐渐消失,并于八十年代绝迹。电子计算机的基础部件不再是机械部件,而是电子管。电子管只有两种基本状态——开和关,因此,以电子管为基础部件的电子计算机普遍采二进制,延续至今。数据在计算机中以器件的物理状态表示,采用二进制数字系统,被计算机处理所有的字符或符号也要用二进制编码来表示。换言之,各种类型的信息(数值、文字、声音、图像)必须转换成二进制数字编码的形式,才能被计算机处理。二进制运算规则简单,有利于简化计算机内部结构,节省设备,便于逻辑判断并提高运算速度。同时,二进制表示数据具有抗干扰能力强,可靠性高等优点。因此,电子计算机能因应复杂的数据信息处理。

  [8]参见江泽民,见前注[5],第1590页。

  [9]《网络安全法》第76条第4项规定,“网络数据,是指通过网络收集、存储、传输、处理和产生的各种电子数据”;《网络安全法》第76条第5项规定,“个人信息,是指以电子或者其他方式记录的能够单独或者与其他信息结合识别自然人个人身份的各种信息,包括但不限于自然人的姓名、出生日期、身份证件号码、个人生物识别信息、住址、电话号码等”;《数据安全法》第3条规定,“本法所称数据,是指任何以电子或者其他方式对信息的记录”;《个人信息保护法》第4条规定,“个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息”;《民法典》第1034条第2款规定,“个人信息是以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人的各种信息,包括自然人的姓名、出生日期、身份证件号码、生物识别信息、住址、电话号码、电子邮箱、健康信息、行踪信息等”。

  [10]1986年,全球的数据量只有0.02EB,约21000TB。2007年,全球的数据量达280EB,约300000000TB,翻了约14000倍。2020年全球数据总量预计达44个ZB,我国占18%。据华为《全球产业展望(GIV)》预测,到2030年,全球数据进入YB时代(1YB≈1万亿TB)。庞大的数据量不仅对存力和算力均提出了高要求。在德国汉堡举行的ISC2022,宣布了全球最新的超级计算机TOP500排名:美国橡树岭国家实验室的Frontier成为全球第一款E级超算(百亿亿次),超越了2年蝉联冠军的日本富岳超级计算机。公开数据表明,Frontier的最大运算能力达到1102.00Pflop/s(110亿亿次),峰值运行达到1685.55Pflop/s,是第二名日本富岳537.21Pflop/s的3倍多。

  [11]事实上,数据之间不相关也是一种相关性。

  [12]参见《民法典》第111条、第1226条以及第四编第六章等有关隐私权和个人信息保护的规定。

  [13]参见《民法典》第501条等条文有关商业秘密以及第二十章有关技术秘密的相关规定、《反不正当竞争法》第9条有关商业秘密的相关规定。

  [14]参见《中华人民共和国保守国家秘密法》的相关规定。

  [15]参见《习近平主持召开中央全面深化改革委员会第二十六次会议》,载中国政府网,http://www.gov.cn/xinwen/2022-06/22/content_5697155.htm,最后访问日期:2022年12月16日。

  [16]《国家安全法》第1条规定,“为了维护国家安全,保卫人民民主专政的政权和中国特色社会主义制度,保护人民的根本利益,保障改革开放和社会主义现代化建设的顺利进行,实现中华民族伟大复兴,根据宪法,制定本法”。《网络安全法》第1条规定,“为了保障网络安全,维护网络空间主权和国家安全、社会公共利益,保护公民、法人和其他组织的合法权益,促进经济社会信息化健康发展,制定本法”。《数据安全法》第1条规定,“为了规范数据处理活动,保障数据安全,促进数据开发利用,保护个人、组织的合法权益,维护国家主权、安全和发展利益,制定本法”。《个人信息保护法》第1条规定,“为了保护个人信息权益,规范个人信息处理活动,促进个人信息合理利用,根据宪法,制定本法”。

  [17]见前注[1]。

  [18] See “The World's Most Valuable Resource is No Longer Oil, But Data,” The Economist, May 2017.

  [19]数字技术在解决问题的同时也会带来问题。以人脸与人脸识别技术为例,人脸是生物人的一部分,且与生物人不可分离。在人脸识别技术发明和运用之前,人脸是识别生物人最为重要的信息载体。彼时,信息、载体和生物人是合一的,可谓“识人必须靠脸”。因此,作为信息载体,人脸几乎不可能被滥用。但是,人脸识别技术发明之后,人脸信息可被提取并以电子数据形式记录,不仅与人脸分离,而且与生物人分离。分离之后,特别是由深度合成算法加持之后,人脸电子数据面临滥用的可能和风险,可谓“靠脸识人须谨慎”。

  [20]参见《5G应用赋能千行百业》,载中国政府网,http://www.gov.cn/xinwen/2022-08/23/content_5706444.htm,最后访问日期:2022年12月16日。

  [21]参见《促进大数据发展行动纲要》,载中国政府网,http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm,最后访问日期:2022年12月16日。

  [22]同上注。

  [23]参见舍恩伯格等,见前注[3],第75页。

  [24]参见《国务院关于促进云计算创新发展培育信息产业新业态的意见》,载中国政府网,http://www.gov.cn/zhengce/content/2015-01/30/content_9440.htm,最后访问日期:2022年12月16日。

  [25]参见《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》,载中国政府网,http://www.gov.cn/xinwen/2021-03/13/content_5592681.htm,最后访问日期:2022年12月16日。

  [26]参见《关于印发〈物联网新型基础设施建设三年行动计划(2021-2023年)〉的通知》,载中国政府网, http://www.gov.cn/zhengce/zhengceku/2021-09/29/content_5640204.htm,最后访问日期:2022年12月16日。

  [27]参见《区块链的优点》,载IBM网站,https://wwwi.bm.com/cn-zh/topics/benefits-of-blockchain,最后访问日期:2022年12月16日。

  [28]参见《国务院关于印发新一代人工智能发展规划的通知》,载中国政府网,http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm,最后访问日期:2022年12月16日。

  [29]同上注。

  [30]参见《北京城市副中心元宇宙创新发展行动计划(2022-2024年)》(通政发〔2022〕13号)、《昆山市元宇宙产业创新发展行动计划(2022-2025年)》(昆政办发〔2022〕113号)等。

  [31]我国《数据安全法》在第五章“政务数据安全与开放”使用了“政务数据”这一概念,但并未对这一概念予以界定。结合该章相关内容,可以将“政务数据”界定为:国家机关在其履行法定职责的范围内依照法律、行政法规规定的条件和程序收集的数据。依据我国《宪法》第三章规定,国家机关主要包括全国人民代表大会、中华人民共和国主席、国务院、中央军事委员会、地方各级人民代表大会和地方各级人民政府、民族自治地方的自治机关、监察委员会、人民法院和人民检察院。据此,前述国家机关应是政务数据的最主要的收集主体。

  [32]参见《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》第五编第十七章“提高数字政府建设水平”相关内容,载新华网,http://www.xinhuanet.com/2021-03/13/c_1127205564.htm,最后访问日期:2022年12月16日。

  [33]参见《国务院关于加强数字政府建设的指导意见》,载中国政府网,http://www.gov.cn/zhengce/content/2022-06/23/content_5697299.htm,最后访问日期:2022年12月16日。

  [34]见前注[1]。

  [35]例如,2021年制定的《海南省公共数据产品开发利用暂行管理办法》第3条规定:公共数据资源是指由政务部门和公共企事业单位在依法履职或生产活动中生成和管理,以一定形式记录、存储和传输的文字、图像、音频、视频等各类可机器读取的数据,法律另有规定或涉及国家利益、公共安全、商业秘密、个人隐私等的数据除外。2019年制定的《吉林省公共数据和一网通办管理办法》第3条规定:本办法所称公共数据,是指全省各级行政机关以及履行和承担公共管理和服务职能的企事业单位(以下统称公共管理和服务机构)在依法履职过程中,采集和产生的各类数据资源。2020年制定的《广西公共数据开放管理办法》第2条规定:本办法所称公共数据,是指各地各部门各单位以及法律、法规授权具有公共管理和服务职能的企事业单位、社会组织(以下统称数据开放主体)在依法履职或生产经营活动中制作或获取的,以一定形式记录、保存的文件、资料、图表、图像、音频、视频、电子证照、电子档案和数据等各类数据资源。2021年制定的《江苏省公共数据管理办法》第2条规定:本办法所称公共数据,是指本省各级行政机关、法律法规授权的具有管理公共事务职能的组织、公共企事业单位(以下统称公共管理和服务机构)为履行法定职责、提供公共服务收集、产生的,以电子或者其他方式对具有公共使用价值的信息的记录。

  [36]参见舍恩伯格等,见前注[3],第16页。

  [37]参见舍恩伯格等,见前注[3],第104页。

  [38]参见舍恩伯格等,见前注[3],第20页。

  [39]参见舍恩伯格等,见前注[3],第109页。

  [40]此外,以消费互联网领域多发、频发的“大数据杀熟”为例,商家借助数字技术和算法,从数据中挖掘出“人傻、钱多、刚需”群体。这个群体消费越多,消费价格越贵。至于消费者用户是自然人张三还是李四,并不是商家兴趣所在。从这个群体身上赚更多的钱,对于商家才是硬道理。在这样的场景,不采集消费者的身份数据、行为数据和关系数据,就完成不了对消费者的精准刻画。一旦完成了精准刻画之后,与数据对应的个人信息已经不再重要,数据与个人信息之间开始出现分离。尽管借助数据“偷窥”消费者个人信息,在技术上完全可以实现,但是商家不一定愿意付出额外的成本,除非“偷窥”之后可以实现更大的利益或者避免更大的损失。当然,商家有技术能力将数据与个人信息再结合,置于再结合甚至“偷窥”的时机,则取决于商家的营销策略和增量利益的大小。

  [41]参见《数据安全法》第1条。

  [42](美)罗斯科·庞德:《通过法律的社会控制法律的任务》,沈宗灵、董世忠译,商务印书馆1984年版,第36、46页。

  [43]见前注[1]。

  [44]我国《民法典》第127条规定,“法律对数据、网络虚拟财产的保护有规定的,依照其规定”。可见,对于与数据相关的权利安排,《民法典》本身并无制度贡献。但是,这种谦抑的立法态度,以及对于“数据”和“网络虚拟财产”的采认、预留制度接口的转致规定,值得肯定。

  [45] See The European Parliament, the Council and the Commission Solemn,“European Declaration on Digital Rights and Principles for the Digital Decade,” https://ec.europa.eu/newsroom/dae/redirection/document/92399, last visited on 16 December 2022.

  [46]See Data ownership,“Rights and Controls: Reaching a Common Understanding Discussions at a British Academy,” Royal Society and tech UK seminar on 3 October 2018, https://royalsociety.org/~/media/policy/projects/data-governance/data-ownership-rights-and-controls-October-2018. pdf, last visited on 16 December 2022.

  [47] See “Position Statement of the Max Planck Institute for Innovation and Competition of 26 April 2017 on the European Commission's Public consultation on Building the European Data Economy (April 26,2017),” Max Planck Institute for Innovation & Competition Research Paper No.17—08; https://ssrn.com/abstract=2959924;“Data Ownership and Access to Data-Position Statement of the Max Planck Institute for Innovation and Competition of 16 August 2016 on the Current European Debate (August 16,2016), " Max Planck Institute for Innovation & Competition Research Paper No.16—10, https://ssrn. com/abstract =2833165;“Data Access and Control in the Era of Connected Devices,” https://www.ip.mpg.de/fileadmin/ipmpg/content/aktuelles/aus derforschung/beuc-x-2018-121 data access and control in the area of con nected_devices.pdf; last visited on 16 December 2022.

  [48]See Patrick Offor,“Data Rights: Single vs. Multiple Ownership?” https://www.isaca.org/re sources/isaca-journal/issues/2020/volume-3/data-rights, lastvisitedon16December2022.

  [49]参见习近平:“不断做强做优做大我国数字经济”,《求是》2022年第2期,第7页。

  [50]截止2022年12月20日,北京、重庆、天津、上海、安徽、福建、广东、贵州、海南、河北、河南、湖北、湖南、江苏、江西、黑龙江、吉林、辽宁、青海、山东、山西、陕西、四川、云南、浙江以及宁夏回族自治区共26个省、自治区和直辖市都以地方性法规或地方政府规章的形式进行了数据立法。此外,广西壮族自治区和内蒙古自治区则以规范性文件的形式进行了数据立法。

  [51]截止2022年12月20日,包括福建、天津、山西、广西、内蒙古、上海、浙江、四川、重庆、江西、辽宁在内的11个省份和杭州在地方数据立法中建立了“政务数据”或“公共数据”授权运营制度。其中,福建、天津、山西、内蒙古是以“政务数据”为授权运营对象;广西、上海、浙江、四川、重庆、江西、辽宁以及杭州则是以“公共数据”为授权运营对象。

  [52]见前注[1]。

  [53]见前注[1]。