当前针对数据爬虫行为的司法实践与理论发展已逐步形成权利保护与自我规制这两种基本范式。其中,权利保护范式旨在为多元主体赋予标准化法定权利,并通过持续完善权利体系以应对不足;自我规制范式则通过信赖行为主体的自我判断能力和市场调节机制,借助法律规范推动谈判的积极作用,形成开放式规制框架以提升效率,并平衡私人权利与公共利益的冲突。由于权利保护范式在实践中存在技术适配性差、忽视公共利益和多方协作受挫等问题,加之作为公共商品的数据具有非排他性与异质性价值,“搭便车”的批评难以成立,有必要采纳自我规制范式,并对合同法规范予以重构。为此,需要超越传统合意框架,转而以公共利益具体阐释为目标,依据数据互联互通原则,充分评估被爬取数据带来的技术创新能否形成互惠机制,从而形成多元主体参与的规制框架。随着互联网技术的深度普及与数字化基础设施的全面渗透,数据已经成为驱动现代社会运行的核心要素。不同场景下生成的多元数据呈指数级增长态势,而网络平台作为数据聚合与分发的关键节点,既通过开放用户交互界面实现数据共享,又因数据爬虫技术的广泛应用而陷入治理困境。所谓数据爬虫技术,主要是指开发者通过自动化程序快速收集网络平台上公开发布的各类数据,并依照其意愿,通过各类算法将爬取的结果加以转化,从而形成为其所用的结构化数据的技术流程。虽然该技术为数字经济发展提供了资源支撑,但是也导致服务器过载、知识产权侵权、隐私泄露等系统性风险不断提升的问题。这一技术引发的矛盾的本质在于:数据资源的开放性与平台控制和用户权益保障之间的张力已超出了传统法律规制范式的应对范畴。为解决前述问题,当前主流的互联网服务供应商普遍采用了机器人协议(robots protocol)、验证码识别、访问行为分析等技术手段来防范爬虫行为,并采用“端对端”加密技术保障数据的传输安全。但是,技术对抗的“猫鼠游戏”难以根治问题。实践中,前述技术手段屡遭破解,平台单方面制定的机器人协议缺乏法律约束力,大量隐私和敏感数据完全未获保护。在此背景下,现有研究通过借鉴和完善既有法律框架,提出了两种解决方案。其中,权利保护范式的支持者主张以保护知识产权和个人信息所牵涉的各项既有法定权利为基准,或扩大解释前述法定权利的范畴,或参照此类法定权利体系,为网络服务供应商和数据库编制者引入新的权利架构,推动相关当事人主动展开交易并在发生纠纷时依法提起诉讼以获得救济。行为规制范式的支持者则主要依托我国《反不正当竞争法》等法律规范,将数据爬虫行为定性为攫取他人竞争优势的不当行为,我国司法实践中大量判例也采用该范式。但是,个案优势并没有转化为体系效能,前述两种观点在实践中均存在较为严重的结构性缺陷:权利保护范式易因其所引入的新兴权利逐步泛化而导致数据垄断和流通受阻;以竞争法为依据的行为规制范式则过度依赖“损害—救济”的基本逻辑,难以回应数据要素市场化配置的动态需求。除此之外,既有规制范式的局限折射出更深层的理论困境:数据作为非排他性、可复制的生产要素,其价值实现高度依赖流通与再利用,静态的财产权划分无法适应数据生态的动态协作需求。因此,当数据爬虫行为从“是否合法”的二元判断转向“如何合法实现利用”的治理命题时,有必要重构“权利本位”的逻辑。此时,以合同为核心的关系型规制范式便显现出独特优势,而如何利用被爬取对象与爬虫技术使用者之间的合同安排来平衡数据使用者、控制者与社会公众的利益,便成了值得深入探讨的命题。有鉴于此,本文将首先尝试揭示这一范式转型的必然性,然后探讨其制度建构的可行路径。当前,针对数据爬虫的主要规制范式可分为权利保护与自我规制这两种类型。其中,权利保护范式侧重于以既有法定权利为基础,通过明确权利主体、划定权利边界并建立相应的救济机制,以应对数据爬虫所引发的各类法律问题;自我规制范式则更加强调制度设计的灵活性,注重行为规范与市场机制之间的互动,尝试通过行为主体的自主判断与协作机制,实现对数据爬虫行为的有效调控。
由于数据爬虫行为会直接影响既有法定权利的行使与保护,遵循权利本位的基本思路,一方面,既有必要理顺在先法定权利的实质内容、行使边界和适用位阶;另一方面,也应当为多元主体另行赋予依层次划分的法定权利。唯有同时展开教义解释和立法续造的工作,方能进一步完善权利保护范式指引下的规范内容,从而驱动行政监管与司法监督程序的持续运转。第一,数据爬虫行为可能侵犯知识产权,特别是著作权。具体而言,数据爬虫行为涉及对既有数据库的访问与使用,并在多数情况下会直接复制并传输数据库所收录的具体数据,而当此类数据库的主要内容受著作权法等保护时,实施数据爬虫行为的当事人便可能突破著作权法所规定的合理使用的限制,构成对既有受保护作品的不当使用,并进而侵犯著作权人所享有的法定权利。与此同时,数据库的筛选与编制同样能够体现出一定程度的独创性,故而亦有可能落入著作权法的保护范围。在比较法上,欧盟立法者曾于1996年颁布了《欧盟数据库法律保护指令》(以下简称《数据库指令》)。根据该指令第3条的规定,即使不考虑数据库的内容,当编制者出于自主且致力于形成独创性智力成果的目标,通过筛选或编排数据库所含具体内容,从而以原创的方式表达其独创性能力,并由此形成其“个人风格”时,此类数据库便因其内容筛选标准或编制方式而满足独创性标准,可适用于著作权法的保护。相反,如果此类数据库的结构是由技术因素、规则或限制措施所决定的,即其呈现出的内容筛选标准或编排方式受限于无法改变的技术水平,则可以认定这些限制并没有为数据库的编制者留下任何自由创作的空间,不受著作权法与《数据库指令》的保护。第二,在部分法域,数据库的内容采集、筛选或编制即使均未落入著作权法的保护范畴,亦可能因法律所构建的“双轨制”数据库保护体系而为数据库提供特殊权利(sui generis rights)保护。以欧盟为例,根据《数据库指令》序言所述,编制数据库所需的人力、技术和财力资源远超简单复制或以其他方式使用现有数据库所需调用的资源,故而未经授权获取或重复使用既有数据库的行为可能会给该数据库的编制者带来严重的经济损失,亦会减缓该领域的技术进步与革新。因此,《数据库指令》第7条为数据库编制者赋予了特殊权利,即当为获取、验证或呈现该数据库所收录的内容而已经实质性地投入了大量投资时,该数据库的编制者能够就此获得15年的保护。因此,即使数据库的结构或组织形式并不能具备独创性特征,数据库编制者亦有权阻止他人爬取并重复利用其所开发的数据库之内容。通过引入这一并行的法定权利架构,欧盟立法者希望能够为数据库服务的开发者提供公平的经济补偿与足额激励,以刺激其积极围绕欧盟本土数据,投资、编制和维护相对应的数据库,从而扩大欧盟在此方面的国际影响力。但是,为数据库的编制者所提供的双轨制保护并未有效转化为现实。在比较法上,除欧盟外,这一权利体系并未得到其他法域的普遍认同。一方面,尽管前述两种法定权利并不必然交叉,也不以彼此为成立之条件,但是数据库特殊权利在保护期限与范围等方面实质上远超著作权等传统知识产权的保护强度。具体而言,由于数据库编制者所享有的特殊权利因其增添、删减或修正该数据库内容的行为而能够得到持续展期;同时,与著作权等知识产权不同,《数据库指令》并未为该等权利规定基于合理使用原则的例外规定,这使得数据库市场趋于集中,数据库的生产与传播亦受到极大的限制。欧盟委员会在2005年发布的该指令实施效果调研评估报告中更是直接点明,引入数据库特殊权利并未促进欧盟范围内对数据库的编制和维护的相关投资。另一方面,数据库的编制者所享有的著作权与特殊权利所能触及的范围亦存在着较大争议。实践中,由于缺乏公开且清晰的权利登记机制,当事人通常无法认定其所享有的权利类型及其范围,这使得对这一问题的确认需要通过司法程序方能得以明确。同时,数据库编制者唯有提供其作出实质性投资的定量或定性证据才能受到保护,因此即使特定数据库的内容由单一来源构成,该数据主体仍并不当然享有对此类数据形成的数据库之特殊权利。换言之,此类特殊权利的保护对象是数据库的编制和维护工作,而非数据的形成过程或数据本身。尽管通过对数据来源主体施加一定程度的限制能够防止有价值的数据归于垄断,但是同样需要考虑的问题是,如若所涉数据库并不受前述两种法定权利的保护,则数据库编制者对于此类数据库的控制权限度为何;相对而言,对该数据库进行爬取的当事人应承担何种义务,或是受到何种限制?对于这一问题,欧盟法院在2015年裁定“Ryanair诉PR Aviation”案时仅部分予以回应:只有当涉诉数据库编制者享有《数据库指令》所规定的两种法定权利时,该指令对法定权利及其保护的强制性规定方才得以适用;当所涉数据库并不牵涉上述两种权利时,除非本国法律另有规定,数据库的编制者几乎享有对其所编制和维护的数据库的全部控制权,并可以通过隐私政策、合同等方式任意调整该数据库的使用范围。但是,欧盟法院对该案的判决并未提供更为详尽的规则指引和制度方案。除此之外,数据处理技术的发展及其所实现的新兴用途亦为规制数据爬虫行为带来了更多挑战。通常而言,当数据爬虫行为与数据库的通常用途相冲突,或不合理地损害数据库编制者的合法利益时,出于保护法定权利的基本目标,似乎可以推论数据库编制者得禁止第三方当事人以重复且自动化的方式获取数据库所收录的非实质性内容。但是,随着人工智能技术的发展,用于训练人工智能系统的数据爬取活动,尤其是对数据库进行全文复制的做法屡见不鲜,由此带来了以下问题:通过算法对受保护数据库的挖掘,如对网站或任何其他形式的数据库的挖掘行为是否属于重复、系统地获取该数据库所包含的内容?换言之,数据库的编制者是否可以直接依据法定权利而对此类行为加以限制?尽管这类问题目前尚无定论,但是总体而言,采用权利保护路径来规制数据爬虫行为的做法意味着有必要进一步完善法定权利体系并提升特定权利的保护强度,同时还需要通过引入法定例外和限制措施来逐步完善制定法,从而对既有法定权利的内涵与范畴进行辅助性说明,由此围绕不同当事人享有的多种权利得以形成相互交织的法律规范体系。
对于数据的爬取与使用行为而言,另一种较为常见的规制路径在于类型化处理当事人的行为,并基于法定权利、公共利益等不同理由而对当事人所实施的各类行为予以评价。对于数据爬虫行为而言,其行为的社会意涵可以从数据爬取时的环境性质、数据爬取的具体方式,以及数据的访问和使用权限的配置这三个层面加以判断和理解。而基于对行为主体自我判断的信赖与市场机制在协调不同主体间关系时所发挥的积极功能,可以提炼出一种自我规制的基本范式。首先,同既有财产法规范与传统保持一致,数据爬取时的环境性质对于数据爬虫行为的性质认定具有重要意义。每一种不同的空间形式及其所孕育的环境均会提供多元的群体规范,网络环境的开放性是影响认定数据爬取行为法律性质的重要因素,而其去中心化的结构特征亦为不同用户提供了多元可能。在传统财产法所处的社会背景中,财产的开放程度已与用户处置财产的权限之间形成了较为稳定且受普遍认同的关联关系。例如,社会对于商店、公园等开放的公共场所与私人住宅的准入权限所形成的共识截然不同。同理,网络环境中的数据在开放的公开网络和限制访问的私有网络中也具有不同的社会意义与价值。在公开网络中,数据通常被认为是普遍对外开放以供公众访问的,而在由具有较高隐私特征的数据所组成的网络环境或需要通过身份验证方能访问的环境中,数据则受到更严格的控制,未经授权的爬取可能难以获得数据映射对象、服务供应方及社会公众的普遍认同。同时,数据的公共性特征也对认定数据爬虫行为的性质具有一定影响。传统财产法对于公共财产与私有财产有不同的调控强度标准:通常而言,公众得以合理使用道路、水利设施等公共财产,而在使用私有财产时则通常需要征得权利人的同意。同样,网络上的公共数据在一定程度上也可以受到爬取和使用。对于可能受到影响的主体而言,由于此类公开数据本就旨在向不特定的公众展示,故而存在相对较低的隐私或受保护之期待。然而,若数据涉及个人隐私、商业机密或受著作权保护的信息,则爬取行为可能被视为侵犯隐私权或知识产权,这就对互联网的开放属性提出了挑战。其次,实施数据爬取行为的技术手段对于认定其行为的法律意义同样重要。一方面,数据爬取的频率和请求方式是影响法律性质的关键因素。若爬虫技术的开发者和使用者通过高频、大量的请求对目标服务器进行抓取,可能对后者的资源产生过度消耗,甚至导致系统瘫痪,这毫无疑问会对遭爬取的系统造成实质损害;相比之下,较低频率、合理数量的爬取请求则因其不会对服务器的正常运行构成干扰而通常不会遭致否定性评价。另一方面,数据爬取的路径也会产生直接影响。例如,一些爬虫程序使用绕过登录验证、反机器人验证等技术手段来获取受限数据或进入受保护的网络,这与通过开放且未设防的网页接口进行爬取的行为形成了较为鲜明的对比。同时,数据爬取手段的隐蔽程度也扮演着重要角色。一些爬虫技术的开发者采用技术手段隐藏其来源或模拟真实用户的浏览行为,以规避被发现的风险,这比相对透明、公开的爬虫行为更难被社会所接受。最后,数据爬虫行为的性质还取决于目标服务器是否设有较为明确的访问和使用权限配置方案,这样的配置方案通常以技术标准和法律规范这两种形式加以体现,从而界定数据爬虫行为的合法性基础。如果目标服务器通过技术标准设置了清晰的访问权限,那么爬虫行为的合法性通常容易界定。爬虫工具在爬取服务器上所载数据前可以读取相关配置文件,开发者亦可以通过阅读网站的隐私政策等信息来获取可供爬取的数据范畴,并调试其所开发的工具,使其能够遵守网站的要求。因此,当网站明确限制爬取某些数据时,违背这些规定的爬虫行为可以被视为一种超越授权的访问行为。除了技术性限制外,法律规范也在数据爬虫的合法性判断中发挥重要作用。以著作权法等为代表的知识产权法和保障计算机系统正常运转的刑法规范等均会对爬虫行为予以直接评价。尽管作用方式有所不同,技术标准和法律规范都能够更为精准地界分前述空间环境与技术手段所无法触及的规范细节,从而为零散规则的体系化工作提供基准。
在前述三个方面的分析基础上,围绕数据的爬取过程,基于对行为主体自我判断的信赖,并充分利用其对市场调节机制的主动适应过程,可以形成一种更为灵活、高效且适应性强的自我规制范式。具体而言,一方面,数据爬取行为主体通常具有一定的自我判断能力,能够根据自身利益和法律规范作出合理决策。在商业环境中,数据爬取者面临着来自法律规范、道德声誉和客户关系等方面的压力。为了避免侵权诉讼、声誉损害及客户流失,大多数数据爬虫技术的开发者和使用者往往会自觉约束自身行为,避免过度爬取、绕过访问限制措施或侵害他人隐私。这种基于长远利益的自我判断能够在一定程度上规范数据爬取行为,不仅减轻了外部监管的负担,还提高了监管的效率,有助于实现资源的合理分配。另一方面,市场调节机制在数据爬取的自我规制范式中具有不可忽视的调节作用。市场机制通过价格、供需关系及竞争态势反映各类行为对市场环境的影响。例如,当市场对某类数据需求增加,并以价格的提升作为信号加以反映时,爬取者会增加对该数据的爬取行为,而数据持有者则会提高保护措施及相关收费标准。这种供需动态反映了市场的自我调节功能,也能在一定程度上减少对外部强制性监管的依赖。与此同时,若数据爬取行为损害了数据持有者或其他利益相关者的权益,市场也会对不合规的爬取行为进行惩戒。比如,部分违背行业准则并爬取大量敏感数据的主体可能面临着行业内禁令、丧失商业合作机会等市场压力,这种通过市场调节机制予以展开的惩戒机制能够避免爬取行为彻底失范。在发展自我规制范式的过程中,法律的作用并非提供强制性的惩戒措施,而是意在推动当事人就爬取行为展开谈判,这意味着客观的判断表征比主观的目的更加重要。唯有通过立法样例与司法个案认定既有的客观表征,即可识别的行为主体、具体动作之内容,以及实际或可能产生的实践后果后,社会才能够逐步对特定行为的影响及意义形成评价与共识。有关数据爬虫的法律规范亦实际上围绕着这三个方面加以演化,并最终形成以验证机制为中心的规范体系。在这一过程中,尽管同样存在着授权与受权的基本关系,但是对于受权主体而言,其所享有的权利仅能作为参与论辩的理由,并作为界定行为性质的门槛,却不能构成对特定目的之限制措施的决定性说明。而在法定权利之外,亦有公共利益等其他理由的参与,并需要从更为宏观的视角平衡损害、风险与收益。因此,自我规制范式实质上是一种描述与规范不同当事人基于私人或公共利益等诸多理由而展开谈判的开放式结构。综上所述,在规制数据爬虫行为的过程中,出于不同的法律传统与实践现状,可以分别从保障当事人享有的法定权利与规范当事人的特定行为这两种视角设计和调适相关法律制度方案。对这两种制度体系的建构过程予以观察,亦可以发现法律规范所需发挥的功能同样有所不同,并且其发展趋势会受到相对应的司法实践影响而有不同侧重,并最终呈现出不同的社会景观。因此,有必要从理论层面重新考察与反思前述两种范式的差异,并结合数据爬虫行为这一具体问题的情境特征综合考量两者的利弊。三、从权利保护到自我规制:数据爬虫规制范式的对比与反思尽管权利保护范式与自我规制范式在政策目标上存在一定共识,但是面对数据爬虫所引发的复杂社会问题,两者所提供的解决路径和制度方案却存在显著差异。分析权利保护范式的理论与现实挑战可以发现,以“赋权”为前提的规制路径正反映出多重局限:这一范式不仅在权利识别成本、边界划定及救济机制构建方面存在技术瓶颈,更可能因激励结构设计不当而抑制技术创新。基于此,自我规制范式因其有能力回应相关批评而成为更优的选择。
权利保护范式的基本逻辑在于,通过将数据视作一种财产性权利,能够将其之上所附着的财产性利益进行有效分割,并赋予各个权利条块以相对固定的边界。在这种范式下,数据权利被分解为不同的模块,每个模块在统一的法律框架下相对独立且明确,从而便于权利的分割、流转和保护。这一做法有助于在具体的法律情境中明确权利人与义务人之间的关系,使数据的归属、使用和转让具备清晰的法律依据。
在权利保护范式的指引下,法律规范的核心重点在于为特定主体赋予法定权利,并提供相应的保护机制。因此,首先要清楚界定数据权利的具体内容,并对不同种类的权利事项进行归纳与分类,以形成不同的权利条块,使不同的权利主体明确其所享有的法定权利的内容与范畴。权利条块的划分使得数据的各项权利更为明晰,进而为数据的使用、交易和保护提供清晰的法律依据。其次,通过标准化处理权利条块的边界,财产性权利保护范式能够有效应对不同主体间的社会关系。在现实中,数据权利的使用和流转通常涉及多个主体,如数据的生成者、收集者、使用者和数据主体等。标准化的权利条块有助于明确不同主体的权利和义务,防止权利边界过于模糊造成他人识别的困难。例如,数据控制权的条块可以规定数据主体对于数据的管理权限,禁止未经许可的访问;使用权条块可以限定数据收集者的使用范围,防止数据滥用。这种权利条块的边界设定使得法律在解释和适用时更具操作性,有助于减少不同主体间的潜在冲突。此外,财产性权利保护范式的逻辑还在于通过对新兴权利的界定与分类,实现其与在先权利的顺畅衔接。传统财产法已为不动产、动产等的权利划分提供了较为稳固的法律规范,而考虑到数据之上所形成的财产性利益与这些在先权利之间存在紧密程度不一的关联,故有必要在既有法律规范的基础之上进一步理顺双方之间的逻辑关系,从而避免在先权利承受较大冲击。为解决这些问题,如延续前述赋权思路继续推演,便不难得出以下两种对现有立法的调整方案:第一,以向数据主体进行普遍赋权的方式,逐步为多元主体构建起不同层次的法定权利体系,从而进一步完善前述规范的缺漏与不足。以欧盟为例,近年来其新颁布的《数据治理法案》(Data Governance Act)和《数据法案》(Data Act)均重点关注非个人数据的流通和交易过程,并沿用了权利保护范式的基本思路。其中,《数据法案》第二章和第六章分别赋予用户对物联网产品所产生数据的知情权和可携带权,以及相应需要履行的法定义务。而为避免数据交易过程中当事人滥用强势谈判地位的问题,该法第13条更是明确列举了被视为不公平和被推定为不公平的合同条款清单,并特别指明在数据交易的合同限度之下,应以促进数据的复制、访问和使用为判断标准,限制另一方当事人合理复制、访问或使用合同约定的数据之条款均应视为不公平条款;此时,制定该条款的当事人需要承担说明该条款并不构成对另一方当事人的不公平限制的证明责任。此外,无论是《数据治理法案》,还是《数据法案》均以但书条款的方式说明了前述诸项数据使用权与《一般数据保护条例》(General Data Protection Regulation,以下简称GDPR)及知识产权等领域立法的体系关系。由此,多重数据权利立法的“叠床架屋”式构造得以释明数据爬虫行为在实践中所形成的社会意义。第二,为辅助性地说明不同主体所享有的各项权利,并理顺不同权利间的冲突,还需引入法定权利的例外与限制措施。尽管细节有所差异,但是在著作权法中,多数法域均对著作权人的作品规定了合理使用制度,准许他人在满足一定条件的前提下不经著作权人授权便能直接使用其作品。除法定的权利登记簿外,这些例外与限制措施亦有助于说明著作权人享有的法定权利之范围。例如,为促进包括人工智能系统在内的新技术发展与应用,欧盟委员会于2016年9月颁布了《数字单一市场版权指令(草案)》,并于2019年经修订后正式成为欧盟法律的组成部分。《数字单一市场版权指令》系统性地梳理了既有法律规范中存在的诸多权利冲突,并明确引入了针对文本和数据挖掘(Text and Data Mining)的特定例外措施。但是,考虑到这一用途的保护范畴相对宽泛,且当事人间规避前述例外措施的合同的合法性仍有待甄别,现有立法的实施前景尚需进一步通过司法实践加以探明。相比之下,GDPR则为个人所享有的数据受保护权的限度提供了较为明确的说明,这可以视为进一步完善立法的指向性参考。
权利保护范式的局限性并不仅限于立法方法和技术层面,更深层次地体现在其理论前提,即“赋权于特定当事人”这一基本条件之上。该条件不仅在司法实践中会遇到诸多问题,而且在理论层面容易面临诸多挑战,使得权利保护范式无法完全适应当代法律需求。首先,权利保护范式的核心思想是通过法律赋予个体以明确、独立的权利地位,使其能主动维护自身权益。然而,在数据爬虫的具体语境之中,这种赋权机制的有效性几乎难以实现。一方面,赋权通常需要明确界定权利主体及其范围,但是在数据共享与流动的背景下,特定当事人的权利界限往往难以明确界定。例如,当个人数据在数字空间中快速流动和频繁交易时,权利人不仅可能未曾认识到其权利已然受到侵害,实施爬虫行为的当事人亦可能无法分辨自动化程序爬取所得数据中牵涉的权利人的权属信息,此时传统的赋权做法并不足以防止数据滥用和隐私泄露问题,因为当事人根本无从开展有效的谈判与磋商。另一方面,赋权范式在技术上往往难以适应复杂的现代技术场景。随着人工智能、大数据等技术的普及,权利的客体不断发生变化,权利保护的对象在信息化社会已不再是单一主体,很多情况下权利会分散在复杂的网络和平台环境中,不再局限于传统的物理形态,因此单一主体赋权逻辑在面对大规模微型权益等更为广泛的公共问题时往往显得力不从心。数据爬虫行为所涉及的数据规模与种类均极为复杂,直接援用既有的登记制度显然并不可行。同时,即使当前法定权利登记簿的编制和维护成本已有所减低,但是在初始阶段的全面登记工作就已面临着登记成本超出意图保护的微型权益之价值这一客观现象,而权利争议所附随的诉讼和执法成本更是必然高企,难以实现长期维持。因此,赋权范式无法满足跨领域、多层次的技术场景需求,且可能因过度关注个体权利而忽视整体性的公共利益。其次,在权利保护范式中,立法通常以某一特定权利或特定主体为中心,忽视了利益相关方之间的复杂关系。例如,知识产权保护的传统方式是对特定作者或发明人赋予专属权利,但是基于数据爬虫行为而衍生出的机器学习和人工智能系统等产品和服务的创造过程往往涉及多方协作,权利难以明确单一主体。这种单一主体赋权的模式不能充分反映创新生态系统的多方利益诉求。试图通过为特定当事人赋权来解决利益分配的问题,更可能导致合作创新者的贡献无法得到充分肯认,进而陷入专利丛林的问题之中,反而会对创新的效率产生钳制效应。而权利的排他性特征亦会阻碍知识流通和公共利益发展,并进一步造成“反公地悲剧”现象,这与保护公共福祉的初衷相悖。最后,“赋权于特定当事人”的前提性条件在技术和社会快速变化的背景下难以真正实现。一方面,技术进步使得权利的边界和内容快速变化,传统的法律框架和赋权方式无法适应动态变化的需求。以网络平台的用户数据为例,用户在上传、生成和公开数据的过程中并不具有对此类数据进行绝对控制的期待,亦不会考虑到其数据对未来的创新用途所能带来的影响。而若将时间这一维度同时纳入考虑范畴,则可以通过著作权一例更进一步认识到法律框架的滞后性所带来的长远影响:由于著作权的保护期限通常持续数十年,这导致众多长久以来已不被当代社会所知晓的作品之权利人仍可基于其所享有的法定权利而否定新兴的特定用途,而这些权利人在创作时显然无法预见这一点。因此,即使通过立法为数据的来源主体赋予更为广泛的数据管理权、删除权和转移权等权利,当围绕数据形成新的社会需求时,现有的权利保护范式亦难以及时扩展或变更权利内容加以匹配,导致现有立法在面对新型数据权益时明显存在回应不足的困难。另一方面,单一赋权模式通常难以顾及基于数据爬取行为而开发的技术创新所带来的正外部性,而外部性的存在通常意味着为数据赋权所产生的市场交易过程不会实现社会福利的最大化。在实践中,交易成本的存在使得经济主体间难以通过自愿协商实现帕累托最优,因而初始产权分配显得尤为重要。然而,即使承认改进初次分配方案的做法可以在一定程度上提升效率,交易成本始终存在的事实也仍然会对其所能发挥的制度功能造成限制。具体到数据交易的语境之中,为数据赋权的正当性论证之逻辑前提在于,期待通过明确的权利登记等措施降低交易成本,从而刺激后续交易以促进资源的最大化利用。但是,市场机制只能反映交易方当事人的支付意愿和偏好,并不能展现围绕数据所形成的技术创新的全部价值,因此这一进路容易轻视数据开发这一社会新兴活动所带来的正外部性,并使得数据的价值被低估,此时,后继创新者自然缺乏足够激励投入成本进行开发。综上所述,考虑到外部性问题难以完全通过赋权于特定当事人予以内化并辅以市场机制的形式加以解决,有必要进一步考察其他可能的规制范式。如若存在同等或更优的制度方案,则权利保护范式不应成为规制数据爬虫行为的当然选择。
在权利保护范式之外另寻出路的理论基础源自数据自身所具备的独有特征,即其非排他性的公共商品属性和其基于预测价值或更广泛的使用价值而体现出的异质性财产价值。具体而言,一方面,数据因其非排他性的根本特征而需要建构不同于传统财产法的独特制度方案。根据法律的经济学分析,建立私有产权的初衷旨在通过赋予个体明确的权利,从而消除资源利用的外部性问题,以避免“公地悲剧”现象,即在资源缺乏明确权属界定的情况下因过度使用而导致的枯竭现象。由于多数传统资源难以迅速再生,故而明确的产权界分能够促使权利人在使用时考虑长期价值,防止无序使用和浪费。但是,数据本质上具有非排他性特征,可以被多个主体同时使用而不会影响他人的使用,亦不会导致其资源陷入枯竭,更不会因高频次反复使用而影响其自身质量,这一特征与土地、房屋等传统私有财产显著有别。因此,将数据视同传统资源并为单主体赋权以避免公地悲剧的规制范式显然与实践脱节,存在逻辑层面难以克服的困难。相反,将数据用于共享和广泛使用可以实现不同应用领域和情境中的组合与创新,从而持续产生新的价值,并进一步推动技术进步和提升社会福利。此外,还有必要申明,数据财产性价值的异质性使得其权利边界的划定更为复杂且具有弹性,无法用单一的所有权结构来管理。这一过程表明,保障数据流通能够产生较为显著的正外部性,而权利范式指引下的交易过程无法充分反映这一社会收益。另一方面,数据的财产性价值主要体现在其预测价值和使用价值上,并呈现出显著的多元、非线性发展趋势。数据的预测价值和使用价值主要体现在其被应用于不同领域和情境中所产生的不同收益。数据本身并没有太多固有价值,其价值往往依赖于数据的分析和挖掘过程。例如,消费者的购买记录在商业领域中可用于市场预测,而在学术研究中则可能用于行为研究和社会心理分析。因此,数据的使用价值高度依赖不同的实践场景和具体用途,并随着规模的增加、种类的多样化和分析技术的进步而不断得到提升,大规模使用和共享数据由此能够产生增值效应,并能够贡献出更多潜在价值。相比之下,由于不动产和动产等传统财产的价值通常会随着使用频次和人数的递增而逐步递减,故而传统财产法的设计逻辑以所有权和用益权为核心,通过经济效益递减的权利层级结构来实现对财产之上所涉社会关系的有效管理,并呈现出较为典型的金字塔结构。但是对于数据而言,其财产性价值更符合“喇叭效应”,即随着数据量的增加和数据类型的多样化,数据的用途和潜在价值成倍增长。随着数据内容趋于多元、丰富,不同数据间的相互关联能够揭示出单一数据所无法呈现的信息,从而产生更深层次的洞见和预测。这一增值特性在大数据分析、机器学习和人工智能等应用场景中尤为突出。在这些领域,数据量和数据多样性直接决定了分析的准确性和预测的精度。因此,对于数据而言,能够以较低的交易成本实现规模效应便尤为重要。而要实现这一目标,便需要提出一种不同于权利保护范式的全新制度方案。也正因此,数据显然无法完全适用于传统的财产权利模型。
从当事人行为的视角,沿用自我规制范式而对权利保护范式提出的反驳亦源于对“搭便车”的错误批评的矫正。“搭便车”行为指的是个体或组织在未承担应有的成本或义务的情况下,利用他人或社会的资源或成果来获利。对于传统财产法体系而言,积极消除“搭便车”行为有其重要意义,这是因为“搭便车”行为不仅容易导致公共资源难以保障持续供给,还意味着社会资源存在着受权主体难以形成控制的外部性,减损了财产权为其所带来的激励效果,导致权利人缺乏足够的动力以谨慎、积极的态度使用和开发其所拥有的财产;而将这一基本逻辑推而广之,便不难理解,广泛的“搭便车”行为会对围绕所有权这一主题而建构的财产法体系带来严重的挑战,因为所有权只会逐步变得有名无实,最终空留形式框架,却无实质功能。而正是由于数据爬虫行为实质上是对既有数据库内容的读取与复制,故而容易被视为对他人劳动成果的恣意掠夺,并常被冠以“搭便车”加以批评。但是,着重考察数据的基本特征便不难发现,参照“搭便车”行为而对数据爬虫行为所作的批评并不准确,因为这种观点忽视了数据的独有特征,对数据爬取行为的评价失之偏颇。反驳搭便车行为的批评可以从数据所反映出的公共商品特征着手展开。通常而言,既往研究在讨论公共商品时常引用国防与公园这两个样例作为典型。其中,前者虽然能够使全体公民受惠,但是显然不可能转为私有,亦不可能排他性地适用于任何特定公民,加之维护国防设施和持续供给国防服务需要投入巨额成本,故常需以国家税收予以填平;后者则可能因公园本身人满为患而丧失非排他性特征,使得任何出于观光、休闲等目的而使用公园的公民无法实现其原初期待,但是将公园转为私有亦会因公众不能自由使用而减损其在提升城市建设水平、居民心理健康等方面所带来的积极效果,且经私有化后公园的权利人亦不可能全然控制公园内景观为附近居民生活带来的增益,即私有财产之上溢出的正外部性。这两个样例分别反映了界定公共商品特征的两种典型情境,即公共商品可能因固定成本过于高昂而无法归于私有,或因权利人俘获全部收益的边际成本过高而无法实现。而具体到数据这一具体情境中,由于其开发过程不仅兼具固定成本极为高昂的属性,需要投入大量资源进行开发与维护,而且数据处理过程中的各方利害关系人亦不太可能因其所付出的劳动而俘获他人享受的全部社会收益,因此,可以认为数据是极为典型的公共商品,此时唯有将其留为公用方能发挥其最大价值。从更为一般的视角展开观察可以发现,前述两种典型样例实质上共同表明,将具备较强公共性特征的商品授予私人所有并任由其处分的做法并非良策。进一步推论可知,对于公共商品而言,在提出可能涉嫌搭便车的批评时,不应以私人利益受损为判断标准,而需参考系争资源是否可能导致“公地悲剧”,而造成“公地悲剧”现象的一大主因便是资源的稀缺性。对于公园而言,由于它们均存在总体规模有限、受益人群所得收益由点及面逐步衰减、无法实现多人同时共享、需不断补足或更新等特征,监管机构不可避免地要长期干预所涉资源的使用秩序,市场声誉机制此时亦能起到辅助性的管理和协调作用。但是,考虑到单个数据并不会随着使用者增多而消耗殆尽,且其价值只会因为使用频次提升和范围扩张而逐步增加,将其赋予私人所有反而会造成“反公地悲剧”,使得数据完全无法得到充分运用,进而无法实现社会价值的最大化。由此,对其可能构成“搭便车”行为的批评自始便无法成立,对数据的爬取在特定意义上可能构成对数据的合理使用。在规制数据爬虫的过程中,鉴于权利保护范式面临诸多制度瓶颈,自我规制范式逐渐展现出更为显著的比较优势。与此同时,随着技术与交易结构的日益复杂,自我规制范式也迫切需要嵌入一套兼具制度弹性与行为可预测性的实践框架,以通过具体机制实现和强化其规范功能。在此背景下,合同机制成为自我规制范式在复杂数据场景中指导实践的基点。
鉴于数据可在不影响他人的情形下得到充分利用,且其利用过程并不会导致自身归于灭失,既有关于公共商品的理论框架便必须予以重构,而其上所映射的规制范式亦有必要予以调整。在传统的公共商品规制与激励理论中,由于非排他性与非竞争性特征是不可自发形成的独特品格,规制机关必须采取特定手段予以维持,方才能够实现公共商品的持续供给和公平取用,这导致公共商品经消耗后的补齐必须充分且及时,“搭便车”的批评实质上也源于这一需求。但是,政府直接供给公共商品和强制性法律规范支撑下的执法行为等均会招致信息不对称、监管俘获、效率低下等批评,以使用者为中心的赋权思路与市场自由交易机制便不可避免地极具理论吸引力,因为政府规制行为在这一理论模型中常收到无法平衡成本与收益的负面评价。然而,数据既不能通过赋权私有的形式予以开发和利用,且其本身即属于无可争议的公共商品,加之前述两个特征无需刻意付出努力便能自我呈现,因此应当从理论层面另谋出路。重新考虑前述论证过程,可以发现当事人所负从事社会生产的义务来源始于对其不事劳作的批评,这意味着必须存在可靠的声誉机制,否则即使特定的群体存在着生存压力,作为独立个体的社会成员亦不会朝着同样的方向努力。更具体而言,对于易遭耗尽但从设计层面必须维持易于取用的公共商品来说,不能及时为其充足供给作出贡献的当事人往往会受到负面评价,而由此形成的社会压力会迫使共同体中的每一位成员不断通过劳动等方式形成受到认可的辛勤成果。此时,声誉机制所能发挥的实质功能便是识别未付出劳动的当事人。即使批评的强度不一,但是未通过劳动积累财富而导致的贫穷亦从反面体现出了这一批评的分量。然而,在数据的语境下,“持续付出”这一要件似乎有不同的意涵。不同于持续对公园草木进行修剪、维持道路交通的公共秩序,或是不断投入资源以提升教育水平等传统公共商品的供应场景,数据本身并不需要通过持续维护才能得到利用;相反,每一种围绕数据所形成的创新用途都是对既有数据的再次编列和整理,而唯有通过汇聚和处理等过程,数据方能取得社会所认可的价值。对于数据来源者来说,这意味着一旦特定数据得以生成,来源者便不再有必要获得法律制度所赋予的排他性激励,而俘获其上所能形成的社会收益便是此类激励的典型。此时,即使数据来源者的隐私、个人信息等权利同等重要,这也并不意味着应当将数据之上可能牵涉的各项权利分门别类列入财产权等体系框架之中,从而维系原有权利框架不至于坍塌,而是必须从区分具体场景及其适用各领域立法的行为规制视角加以理解,因为数据的社会价值本身便是从公共商品的视角得以证成的。因此,在对待数据所引发的社会问题时,有必要采纳一种非自愿主义的视角重塑相关理论构想与规范实践。考虑到社会应当以实现互惠为组成与运转的基本条件,由此权利与其上所形成的同意理论并不居于首要位置,而应当为持续的协商与锚定标准的截断性判定所让步。由于以数据爬虫行为为基础而实现的人工智能等技术进步所带来的社会收益是无法刻意避免的公共利益,无论是否在主观层面刻意寻求获得此类收益,任何既定权利人都会从中受益,这导致既定权利人对其所享有的权利之处分形式所表达的同意不仅难以促进社会合作的形成,还有可能因禀赋效应等因素而遏制技术创新。同时,由于这些社会收益对其所赖以生存的社会之共同体而言不可或缺,因此既有权利人对于促成科技进步的开发者所负有的宽容义务并非源于既有权利与其上所主观授予或拟制的同意,而是源于需要对其从社会这一共同事业之中所获得的收益予以适当反哺,从而推动科技进步的不断延续与发展。正是因为既有权利人能够以这种方式受益,所以可以推论出其有义务为供给这些社会收益的社会制度或结构作出贡献,而要求其承担与其他贡献者相当的负担。具体到数据爬虫这一具体语境之中,由于复制和传播数据的边际成本几近为零,有必要考虑的重点在于数据贡献者的规模是否足够广阔,以及数据的来源和内容能否持续得以更新。同时,由于总会有一部分新用户成为贡献者,不断出现新的“搭便车者”通常反而意味着更宽广的发展前景,对于数据与其上所形成的技术行业而言亦是一件喜事。此时,基于对公共利益与基本权利的阐释而形成的侵权法规范体系能够辅助性地说明社会行为的基本界限,因为交易过程本身不应由于可能构成侵权而需要全然禁止,而是需要予以保留,再辅以监管或诉讼的方式加以事后调整。因此,这一过程从根本上推翻了以不动产为中心建构起来的传统财产法所塑造的社会基本样态;相反,对于数据而言,不应以交易成本趋于零为目标,而是应以趋于稳定且落入可预计的范畴这两条轴线予以考量,而唯有持续且高频次的交易过程才能清楚界定前述两条轴线的所及范畴。但是,仅有侵权法规范作为辅助性说明工具,并不能使数据的流通和交易过程摆脱混沌状态而形成有序的社会秩序。因此,考虑到合同法规范对于当事人之间权利和义务的规划具有理清功能,便有必要重新考虑合同法理论,并相应地重构其规范内容。当然,仍有必要说明的是,前述说理并不意味着权利保护模式完全无法回应数据爬虫行为所造成的全部问题。恰恰相反,对这两种理论范式的比较意在指出,相较于行为规制范式,数据之上所存在的一部分独有的特征使得权利保护范式自身存在的困难无法径直被忽视或予以克服。正是因为可能存在资源消耗殆尽现象,以及必须消除搭便车行为,所以传统社会中出现私有产权制度;除了知识产权外,过往的财产类型大致也并未超出理论所预设的范围,这使得直接套用前述逻辑并未置理论于难堪的境地。但是,对于数据而言,反向套用这一基本逻辑,即先创设私有产权、再凭此界定某种行为系搭便车行为的做法并不正确。因此,先交由私人分配、再以公共利益为理由进行干预的逻辑链条自始就不适用于数据;相比之下,行为规制路径显然更具合理性,毕竟当一种方案存在难以绕开的严峻挑战,另一种方案却仍能保留一定的灵活空间时,后者显然是更佳的制度方案。
即使脱离数据爬虫的具体语境,合同法规范亦并不全然仰仗当事人之间的合意;在如毒品交易、赌博等法律所严格禁止的特殊情境中,合同效力亦严格受法律约束。因此,“以合意为中心建构的合同常会让步于公共政策目标”这一看法已成为一般共识,当前我国民事立法业已普遍接受这一观点。那么,在回应前述问题时便有必要考虑,合同法规范为何仍有必要针对数据及包括爬虫行为在内的具体应用加以调整?对这一问题的回答,在一定程度上也有助于刻画出围绕数据而形成的合同法理论与法律规范的基本样态。鉴于数据的生产和处理活动普遍由私主体完成并发展,因而即使存在较多法律强制性规定,对于包括数据爬虫行为在内的处理行为仍应以私法作为优先处置的工具。而正如前文所述,对数据的规制所欲实现的最终目标并不是围绕财产权建立登记制度,以便国家和私主体形成对此类财产权强度不一的控制,而是应当尽可能推动以信赖为基础的社会合作,其在数据领域的具体表征便是数据的流通活动,唯有提升数据流通的频次才能提升数据之上各类用途所能形成的社会收益。因此,为遏制爬虫行为而单方面拟定的机器人协议、隐私政策等文件的效力便不能再从允诺与否的立场出发,而是必须从公共利益的整体视角出发提供新的理论建构。换言之,在数据这一具体领域之中,单个数据主体所能发挥的私有财产处置与分配作用并不具备基础性的理论意义,而是成为服务于诠释公共利益这一目的的衡量标准。因此,在这种预设下重新看待合同法的基本功能,便能够理解如下判断的合理之处:无论表现形式为何,显然不应仅以同意要件及其所反映的双方共识来看待包括数据爬虫在内的一系列法律文件的效力,而是应当将其视为公共利益映射到特定主体的过程、方法与内容的载体,分别从不同主体的视角对合同法规范所能发挥的多元功能加以阐释。其中,对于数据被爬取的当事人而言,应以实现互联互通作为缺省规则,准许当事人就数据爬取的数量、频次和具体内容等通过单方声明或合同的形式自治,从而形成具有场景和领域特征的自我规制框架。采用自我规制范式的原因在于,通过准许数据的持有者和处理者就数据传输、处理和交易等社会活动依据场景展开自由协商,能够最大限度地提升数据的使用频次和范围,实现数据价值的最大化。在这一过程中,以合同等形式所呈现出的自治安排不应被理解为是一项静态、封闭的商品买卖协议,而更应被视作一项强制数据交易双方履行交流义务的制度性框架。与单次的商品交易不同,这类合同反映的是交易双方在长期合作中形成的一种信任结构、预期协调机制与灵活调整空间。基于此,在数据爬取的语境中,考虑到数据价值的增长路径,前述当事人通过谈判所达成的合同之功能在于确定数据爬取的边界条件和行为预期,使双方在不确定的互动中保持利益协调与制度稳定。具体而言,对于市场中的数据提供方与数据爬取方而言,由于双方在合作初期均无法准确知晓另一方对数据的使用意图、承载能力和安全容忍限度,此时,数据提供方通常拥有关于数据库构建成本、运营机制、安全边界等方面的信息,能够形成一定的验证方式和技术壁垒,提高未经协商的爬取行为的成本与不确定性。同理,实施爬虫行为的主体对于行为的预期意图及社会价值,特别是对所爬取数据能够实现的功能与替代成本等具有较为良好的判断。唯有约定一套适应未来调整的机制,方能实现数据高效流通,促进数据的社会价值最大化,从而持续调整并形成共识基础。因此,数据持有者虽然并非自愿与所有爬取方建立合同关系,但是,只要数据开放行为能够为实现数据互联互通创造普遍且必要的制度条件,持有方就有义务在可接受的条件下维持这一制度运作的基本功能。换言之,在该场景下,当被爬取方明确以声明或合同形式准许爬取数据时,被爬取方便需要履行技术层面响应特定数据访问请求、准许他人占用服务器资源、构建部分开放的数据库结构、准许不特定当事人访问数据库内容等积极的容忍义务。同时,抓取方则应当履行合理使用数据、标注数据来源,以及在技术层面遵守爬取频率限制、安全机制与机器人协议等规范的义务。更进一步而言,在这一关系结构中,合同主要起到信号机制的作用。通过在合同中明确安全技术要求、声明数据用途边界、制定回应式的治理机制,数据持有方传递出“有限开放、可协商”的信号,从而引导爬虫行为的实施者与其展开有效谈判,并营造受控且可持续的合作秩序,而非采取激进的反爬取策略。同理,实施爬虫行为的当事人也应当通过明确自身使用目的、提出基于公共利益的访问请求等方式,展现其合作诚意与对具体用途正当性的判断能力。这种互动过程使得合同本身成为制度性博弈与合作关系生成的基础。而当数据爬取行为产生争议时,双方可依托先前建立的行为预期、机制性安排与合作惯例,通过对合同条款作回溯订立背景的解释与协商更新,实现对分歧的制度性吸收与转化,避免因一方违约或滥用爬虫机制而引发的极端对抗。此时,前述数据交易合同的正当性源自持续的合作过程,而非初始的一次性要约与承诺。而对于行政机关等公共规制主体而言,应当以“任意当事人对数据互联互通的基本现状所做的改变,会致使其背负致力于确保他者不会因此而陷入更糟糕境地的义务”作为监管数据爬虫行为的分析主轴。具体而言,由于任何围绕数据爬虫等获取和处理行为的合同或单方声明均实质上是对公共利益的特定阐释,作出阐释的主体便有必要超越合同或单方声明所牵涉的主体,通过确保全体社会成员能够受益来实现互助,这一要求对于爬虫行为的实施主体和爬取对象均应适用。而在规制的过程中,有必要充分尊重具体技术场景下的行业惯例与通行做法,从而为不同领域的数据开发标准和利用限度划定基准。在考察爬虫行为时,公共规制主体有必要以事中和事后视角介入评估与衡量此类数据处理者在获取数据后所能实现的数据传播频次、范畴和技术创新价值,从而实现事后的效率最优(ex-post efficiency)。在事中的评估过程中,需要深入分析数据处理者在获取数据时所采取的技术手段和实现路径,进而衡量数据被获取后的传播频次与范畴,以及数据利用过程中可能带来的技术创新价值。如果部分数据处理者利用爬虫技术高效地获取了大量数据,但这些数据并未得到充分应用,即未能进一步提供市场分析、趋势预测或技术创新等方面的支持,则此类爬虫行为应当被禁止,被爬取对象所采取的较为严苛的验证措施、保密机制等技术手段亦具备一定合理性。此时,公共规制主体应参考我国《民法典》等对合同内容的合法性、公平性与公序良俗等评价标准,对隐私政策、机器人协议等所载内容和实施此类文件中所列事项的技术手段作实质性审查。同时,还应当重点关注爬虫行为对数据持有者及其数据库内容的潜在影响,特别是对包括知识产权、国家安全和市场竞争等其他法律规范目的造成的影响,以及编制和维护数据库内容的固定成本、验证访问权限的边际成本、数据库所处市场环境和当事人的市场地位等因素。在商业竞争环境中,不同数据持有者所采取的限制和保护措施强度参差不齐,举报和起诉频次亦有所差别,由此逐步形成了行业惯例的谱系,这对数据爬虫实施主体和监管机构而言均可成为参考;如果要使此类声誉机制发挥最大效用,便应在实践中允许当事人就技术措施展开合理攻防,从而避免“虚空打靶”的规制错误。此外,公共规制机构亦应对数据库所处的市场环境进行评估。对于高度竞争或垄断的行业而言,数据的获取和利用可能直接影响到市场的公平性和竞争态势,因此,公共规制机构有必要权衡数据持有者的市场地位、该数据的商业价值,以及爬虫行为对行业整体创新和竞争的长远影响,从而围绕数据爬虫行为形成较为综合的考量框架。而从事后的视角来看,有必要优先采用形式判断的方法,重点评估爬虫行为与机器人协议等文件所载内容的异同。对于通过爬虫方式获取并传播受其他法律规范所保护的数据之行为,应当以当事人所发布的隐私政策、机器人协议等文件内容作为基准;对于超出前述文件所载明的爬虫行为限度及其所获内容,则应当衡量“严守前述文件所列可供爬取的数据范畴、频次等”之判断是否有助于促进数据互联互通,而非对实施爬虫行为的当事人是否能够真正实现技术创新径直作出判断。当这一规范目的无法实现时,应准许爬取方通过申诉举报和司法诉讼的方式取消相应限制;对于前述文件并未列明的数据库内容,仍应以数据的互联互通作为执法原则,并可准许当事人依据既有法律部门之中所规定的其他侵权法规范,以个案执法和司法审判的方式寻求救济,防止数据互联互通的社会价值对法律所保障的其他公共利益造成倾轧。尽管围绕财产权所形成的权利保护范式在保障传统财产与其上所能实现的各类功用方面发挥了较为重要的作用,但考虑到数据的独有特征,以自我规制范式予以调控的做法能够在理论层面实现较强的弹性。这种范式不仅从整体视角为社会接纳和包容新兴技术发展预留了空间,而且对于数据爬虫这类后果较为随机的行为而言,亦具有“避免因财产权禀赋效应引发交易障碍”这一独特价值。在实践发展的过程中,通过保障数据的互联互通,数据之上所牵涉的各方主体均能够以互惠为基准实现较为有效的团结与分工,从而使得公共利益这一宽泛的概念获得了较为具象的阐释。从这个角度来看,从财产到合同的规制范式转移并非对法律实践的描述性观察结果,而是一种理论发展的必然。目录|《东方法学》2025年第4期(数字化专刊3)雷磊|完美的效率还是负责任的正义?——大语言模型时代数字司法的价值反思
