作者:蔡川子,华南理工大学法治经济与法治社会研究中心副研究员,法学博士
摘要
数据抓取是数据处理的前提,是数据产业的基础,更是推动数据普及运用的重要途径。然而,我国包括《数据安全法》在内的相关立法,并没有为数据抓取划定边界。实践中,《反不正当竞争法》一般条款的泛化适用已在某种程度上阻碍了数据经济社会效能的发挥。数据问题的合法性判断具有高度场景化的特点,抓取行为是否具有不正当性应结合数据交易价值和个案抓取手段进行判断,抓取行为是否产生竞争损害则取决于对后续数据产品及服务的市场替代效果评估。若以“数据垄断”对不正当抓取行为进行抗辩,在无法达到垄断的市场判定标准情况下,限制抓取行为也将构成数据不正当竞争行为。此外,在竞争法框架下还应考虑自由公平竞争秩序、市场创新,以及消费者多样化选择等公共利益目标。
关键词:数据抓取 竞争利益 竞争法 法律规制
数据抓取是数据处理的前提,是数据产业的基础,更是推动数据普及运用的重要途径。然而,我国包括《数据安全法》在内的相关立法,并没有为数据抓取划定边界。实践中,《反不正当竞争法》一般条款的泛化适用已在某种程度上阻碍了数据经济社会效能的发挥。数据问题的合法性判断具有高度场景化的特点,抓取行为是否具有不正当性应结合数据交易价值和个案抓取手段进行判断,抓取行为是否产生竞争损害则取决于对后续数据产品及服务的市场替代效果评估。若以“数据垄断”对不正当抓取行为进行抗辩,在无法达到垄断的市场判定标准情况下,限制抓取行为也将构成数据不正当竞争行为。此外,在竞争法框架下还应考虑自由公平竞争秩序、市场创新,以及消费者多样化选择等公共利益目标。
数据抓取是数据处理的前提,是数据产业的基础,更是推动数据普及运用的重要途径。然而,我国包括《数据安全法》在内的相关立法,并没有为数据抓取划定边界。实践中,《反不正当竞争法》一般条款的泛化适用已在某种程度上阻碍了数据经济社会效能的发挥。数据问题的合法性判断具有高度场景化的特点,抓取行为是否具有不正当性应结合数据交易价值和个案抓取手段进行判断,抓取行为是否产生竞争损害则取决于对后续数据产品及服务的市场替代效果评估。若以“数据垄断”对不正当抓取行为进行抗辩,在无法达到垄断的市场判定标准情况下,限制抓取行为也将构成数据不正当竞争行为。此外,在竞争法框架下还应考虑自由公平竞争秩序、市场创新,以及消费者多样化选择等公共利益目标。
数据抓取是数据处理的前提,是数据产业的基础,更是推动数据普及运用的重要途径。然而,我国包括《数据安全法》在内的相关立法,并没有为数据抓取划定边界。实践中,《反不正当竞争法》一般条款的泛化适用已在某种程度上阻碍了数据经济社会效能的发挥。数据问题的合法性判断具有高度场景化的特点,抓取行为是否具有不正当性应结合数据交易价值和个案抓取手段进行判断,抓取行为是否产生竞争损害则取决于对后续数据产品及服务的市场替代效果评估。若以“数据垄断”对不正当抓取行为进行抗辩,在无法达到垄断的市场判定标准情况下,限制抓取行为也将构成数据不正当竞争行为。此外,在竞争法框架下还应考虑自由公平竞争秩序、市场创新,以及消费者多样化选择等公共利益目标。
一、数据抓取行为的中立性与竞争性特点解析
数据竞争利益在不同市场主体之间的流转与冲突,使得数据抓取纠纷层出不穷,对司法理念和审判考量因素提出了更高的要求。平台数据不正当竞争纠纷的根源在于产业内的利益争夺,故分析此类问题需以解构数据竞争行为作为基础,在总结数据竞争行为特点的基础上,提炼出抓取行为构成不正当竞争的共性。
(一)数据抓取行为的技术中立性
数据抓取是指利用自动化算法程序,按照预设路径遍历网络内容,实现标的信息抓取并保存至本地数据库的过程,其核心技术是网络爬虫(web crawler),其本质上是一套实现高效下载的系统,采用遍历网络内容的方式,按照指定规则,自动提取所需的网页数据,并下载到本地形成互联网网页镜像备份的程序。从应用层面看,这一技术最早为搜索引擎获取数据来源的支撑性技术之一,其依赖自动抓取互联网上的第三方网站网页,再将抓取到的网页进行备份、建立索引,储存到自身服务器缓存中。因此,网络爬虫技术作为一项有利于社会经济发展的搜索技术,对于技术行为本身,立法与司法应秉持中立原则。但是,技术中立原则在具体数据竞争纠纷中的应用,则需要结合技术使用的具体方式、竞争目标,以及技术运用所产生的市场竞争效果予以综合考量。我国司法实践中对“技术中立原则”的适用边界已经给出较为明确的界定,以技术中立原则给予法律责任豁免的情形通常仅适用于技术提供者,而对于实际使用技术的主体,则应视其具体行为是否符合法律规定进行判断。因此,数据抓取技术的运用存在恶意使用、危害社会公共利益,或违背商业道德、扰乱公平竞争秩序,均属于超越技术提供者的中立身份,违背技术中立原则的初衷。
数据抓取技术及数据应用的创新具有推动社会经济发展的积极意义,但是技术也存在被恶意使用的问题。为了应对抓取技术所带来的访问压力、维护数据利益,与数据抓取行为相对的限制数据抓取技术随之出现。限制数据抓取在技术上体现为使用一切可能的措施、技术,阻止他人批量获取自身网页数据,其关键在于识别与阻挡批量信息抓取,具体表现形式包括网站robots协议或爬虫协议、用户IP访问识别、自动内容访问协议等。当前,数据抓取的相关纠纷频发,大多数起源于后进入相关市场的竞争者受制于数据获取困难的竞争状态,原本中立的数据抓取技术在此背景下日益成为经营者夺取核心数据资源并攫取其竞争优势的技术手段。应当意识到,数据资源的开放共享是实现数字经济发展的必由之路,但同时,数据的获取和运用不仅决定着数据企业经营成败,也决定着数据行业业态是否向着良性竞争的方向发展。因此,坚持数据抓取的中立技术本质与防止过度的数据抓取限制甚至数据垄断之间的平衡,对数据竞争规制亦是挑战。
(二)数据抓取行为模式的隐秘性
数据抓取竞争行为的竞争双方具有不对称性。在传统竞争行为中,参与竞争的市场主体基本处于体量相当的层面,在多数情况下以直接竞争者的角色出现。而在平台竞争环境下,它们在经营体量和规模上相距甚远,甚至连主营业务都不尽相同。参与竞争的市场主体已从一种直面彼此、直接竞争的关系逐渐演变为依附、寄生的关系。大型互联网数据平台通常拥有庞大的投资者群体和知名度,而数据抓取方可能仅是一家提供计算机技术服务的小微企业,数据双方甚至并无业务交集,数据抓取小微企业在经营规模上一般不足以与大平台相抗衡。但其可以通过数据抓取手段,分析大平台的业务模式摸索大平台用户的喜好和消费趋势,推出相关插件工具和程序以分割大平台的客户粘度,由此实现数据抓取技术的客户数量变现。因此,平台环境下的竞争双方或市场主体在行业内可以处于任何量级,这在传统的不正当竞争纠纷中并非常态。
同时,数据抓取竞争行为的行为模式具有隐蔽性、竞争目的具有抢夺性,体现在两个层面。第一个层面是行为主体更隐蔽。在传统的竞争行为中,竞争双方以直接竞争对抗关系为常态,对于市场主体而言,其竞争对手和反制目标确定且显而易见。但在数据竞争环境下,部分参与竞争的市场主体会选择以自身下沉的“去中心化”模式实施不正当竞争行为。该种行为模式使得进行数据批量获取行为的主体可以隐居幕后,如通过分散的数据抓取地址、多次重复型抓取等,令行为痕迹较难追溯。第二个层面是行为效果更隐蔽,背后竞争目的具有抢夺性。数据抓取技术在具体实施过程中可具有不同的前端效果和后台效果——前端效果往往仅为假象掩护,后台效果才是其真正的竞争目的。比如,前端数据抓取行为表现为计算机信息重复过滤和筛选等,但在此过程中,其想实现的竞争目的是通过数据抓取行为实现诸如篡改用户浏览器主页、对不同厂商浏览器进行区别对待、算法歧视、数据“搭便车”等抓取效果。因此,对数据抓取竞争行为的定性,需要从抓取行为的实质层面进行剖析和解读。
(三)数据抓取行为影响的广泛性
数据抓取竞争行为的第三个特点是抓取行为的影响具有一定的产业延伸性。从正面角度分析,平台经济本身具有“放大效应”,各市场主体之间关联紧密,个体竞争者实施的竞争行为比较容易波及广泛,换句话说,由于数据竞争者之间可能存在较深的依附关系,故抓取竞争行为容易对被依附一方的商业环境造成破坏。然而,从反面角度看,也正是由于数据抓取行为所具有的这种产业延伸性,企业才可能通过数据处理、交易和结合不断完善和创新相关产品与服务,数据才最终得以通过企业间的数据型活动产生更大的经济价值。如旅行搜索引擎使用数据预测特定路线的航班价格趋势、电子商务网站通过分析用户的购买信息和浏览记录为用户推送购物建议。当数据转化为有价值的信息或内容,由此创造了数据实现其社会和经济价值的节点。
因此,竞争法针对数据抓取问题的规制应首先关注规制对象,即数据实现交易价值的竞争手段特点与造成竞争损害的具体模式,此二者皆因数据价值的产生方式而与产业形态直接相关。同时,数据抓取是否会造成竞争损害又进一步与服务市场相关。因此,对于这些关系的清晰梳理将成为数据不正当竞争行为判定的分析起点。
二、数据抓取竞争法规制的必要性及路径梳理
针对数据抓取问题,首先应明确的是,数据的利用价值不在于类似知识产权一样的创造性或新颖性,而在于其所蕴涵的通过分析、挖掘才能发现的潜在价值。同时,数据天生具有的流动性使得法律对数据的保护力度较弱。除了法律规制,市场机制也已对数据抓取竞争行为作出了反应。一些大型互联网平台正在成为创新的阻碍者——其试图通过设置限制数据抓取手段,破坏新进入者和潜在竞争者的商业模式,以此巩固和维持其市场地位。平台数据市场的这种具有自发性的应对机制反映的是抓取行为合法性边界问题,对此,除刑法中明确规定了非法获取计算机信息系统数据罪外,民法中并无专门的法律规范进行调整。基于此,以下将对数据抓取相关的现有法律保护模式进行分析和比较,归纳适用竞争法对数据抓取问题进行规制的必要性。
(一)数据利益不适合用传统民法和合同法进行保护
根据传统财产权劳动理论,劳动使人们对原来处于共有状态的一切拨归了私用,从而产生了私人所有权,亦即“财产权的正当性来源于劳动”。抛开抓取行为,就数据而言,数据的采集、分析和存储需要数据经营者投入大量的人力和资金,且根据上文所述的数据特点,数据能够产生巨大的经济效用正是基于这些投入而产生的后续数据应用价值。因此,数据经营者似乎对此类具有交易价值的劳动成果应享有某种类似传统民法所保护的财产权益。当前部分学者肯定了数据属于民法上“物”的范畴,认为数据具有民法上“物”的法律属性,基于此,数据收集者收集和整理数据的活动属于劳动投入,应取得该部分数据的物权。此外,也有理论提出针对数据问题构建新型民事权利,如部分学者提出的“数据资产权”概念,包括为初始数据的主体配置基于个人数据的人格权和财产权;同时,赋予数据从业者具有排他性的数据经营权和数据资产权。还有部分学者提出采用“自物权与他物权相结合”的权利分割模式,根据不同主体对数据形成的贡献来源和程度的不同,设定数据原发者拥有数据所有权、数据处理者拥有数据用益权的“二元权利”结构。但是,以传统民法规范进行数据保护及相关行为规制存在的问题是,强调数据的财产属性或主张将其物权化,皆与数据的本质特性不兼容。
数据抓取和后续价值的产生,本质上是信息的汇集。相比于传统民法意义上的动产、不动产等有形财产,数据抓取行为产生的效果并不发生有形控制的占有;数据抓取之后进行的分析使用并不发生物的损耗使用。因此,数据抓取这种市场行为所涉及的竞争目标,已经超越传统民法上对物的保护范畴,通过物权法规制数据抓取行为并不合适。
除了物权法,通过合同法调整数据抓取行为同样无法与数据本质特征自洽。数据产业涉及平台经营者、数据服务使用者和消费者等多方利益,因此,无论是否发生数据抓取的事实,数据分析、储存及任何运用过程均涉及大量调整或规制数据流转关系的合同。合同法调整动态的财产流转关系,在数据领域,合同原则上只能约束与数据平台或数据经营者存在合同关系的相对方,由此,数据经营者和数据平台可通过爬虫协议、robots协议等反抓取技术措施禁止网络搜索引擎非法获取数据。而一旦超出合同相对关系,数据抓取行为通过非法侵入计算机信息系统进行,数据经营者或平台并不能根据爬虫协议寻求法律保护。
(二)数据抓取的相关利益不能完全适用著作权法保护
经过分析或者通过抓取手段获得并经过加工的数据,由于其产生需经过一定的人为劳动和分析加工成份,其内容或呈现效果可能具有一定的独创性。但是,数据抓取这种重复、自动的行为模式,对内容的选择主要通过机器计算机按照给定条件自动完成。也就是说,采用相同的数据抓取工具抓取和分析相同数据,最终基本都能得到相同的分析结果。因此,这并不能反映数据创造者或数据被抓取后所产生的创新价值,不应由个体垄断或给予其著作权法保护。采用著作权法调整数据抓取问题的本质冲突在于,数据抓取行为在某种程度上属于设定的算法,而算法的可版权性并不代表经由此算法处理取得的数据结果具有可版权性。
(三)数据利益的竞争法保护模式和路径梳理
如前所述,数据平台或数据经营者投入劳动所采集和分析的数据,在物权法或著作权法上的定性目前暂不明确。但是在数据行业及数据竞争市场上,加工过的数据无疑是决定数据企业竞争优势的核心要素。对数据竞争优势的法律保护长期缺席、数据平台或数据经营者的投入产出低于正常比例,将不利于数据产业的良性竞争及业态发展。因此,具有实用性、能够为权利人带来现实或潜在经济利益、已具备无形财产属性的数据,应属于受反不正当竞争法保护的法益。在此基础上,利用抓取技术破坏他人市场竞争优势、具有并存在为自己谋取竞争优势的主观故意、违反诚实信用原则、扰乱竞争秩序的数据抓取行为,应构成不正当竞争行为。
针对平台数据抓取行为天然具有的市场竞争性,以及数据抓取行为所体现出的主体不对称性、手段隐蔽性及竞争效果延伸性等分析已经说明,适用传统物权法或合同法解决数据竞争问题不尽完善,平台数据抓取问题应落入《反不正当竞争法》规制的范围之内。首先,《反不正当竞争法》本质上是行为规制法,防止不必要的经济损失,促进自由竞争和市场创新。其所保护的利益主体随着竞争形态的变化而动态发展,一方面重视保护诚信经营者利益,另一方面重视消费者利益,这是两项稳定的立法初衷。具体到数据抓取问题上,数据抓取竞争纠纷所涉及的经营者主要包括提供搜索引擎服务的平台经营者,以及被抓取方的占有数据方经营者。严格来说,搜索引擎提供商与数据占有者不一定属于同一市场或者直接产生竞争关系,其抓取行为产生不正当性主要通过抓取技术分流了对方的市场竞争优势,攫取被抓取方利用自身数据进行交易的机会。此处如果对于数据占有方和数据抓取方的法益保护程度采用与权利同等程度的保护,容易出现限制他人竞争自由的限制效果,进而产生反竞争的负面作用。同时,以数据抓取问题为代表的网络竞争行为也应同时落入《反垄断法》规制的范围,这也是立法探讨中较常被忽视的一点。当前《反不正当竞争法》以明示立法的方式将网络不正当竞争行为纳为其调整内容,直接导致反垄断法规制在该领域被架空的困境应受到重视。
在数据抓取问题上,竞争法应遵循反向规制逻辑,即并不直接通过法律条文规定何种权利受保护,而是通过调整数据竞争者的抓取行为本身来实现对数据经营者法益的保护,进而实现数据行业的数据流通和经营自由,保障数据平台竞争秩序,从而实现对数据竞争自由的法律保护。探讨平台经济和数据竞争纠纷的规制路径,首先应梳理清楚数据抓取行为以及与之对应的限制数据抓取行为的合法性边界,包括判定数据不正当抓取的标准因素、抓取行为产生的竞争损害如何衡量、数据领域竞争关系的划定和针对数据不正当抓取的抗辩。在此基础上归纳理论与司法实践中针对数据抓取竞争行为的法律规则,明确反不正当竞争法在该问题上的适用边界和逻辑理路。
三、数据抓取竞争法规制的重点
数据的利用价值在于通过分析、挖掘所产生的后续利用价值。同时,数据天生具有的流动性、数据抓取行为的特点,决定了调整以数据抓取行为为代表的数据竞争行为,应当从平台发展核心要素这一本质核心要素出发,基于数据的产生及运用的规律,明确抓取行为的违法性判断标准,在竞争法语境下厘清竞争关系和竞争损害的含义;同时,并在平衡数据竞争多方参与者利益的情况下实现个案公平。但是,当前《反不正当竞争法》和《反垄断法》框架似乎并没有做好充足的制度准备。
(一)数据抓取行为违法性判定标准欠缺
与数据保护相关的理论已经明确,数据的流动性这一物理属性决定了对数据的保护可能终将有赖于数据控制者自身的技术和制度防护。在此基础上,如果数据控制者采取技术防护,则应根据被抓取数据的种类决定所适用的法律,比如抓取个人数据可适用隐私法相关条款;抓取企业数据则适用技术合同进行约束;等等。而制度防护主要针对的是抓取公开数据问题。学界普遍认为抓取公开数据原则上不构成不正当竞争。然而,一旦数据提供者对自身数据设置了安全保障措施,行为人通过破解该技术措施而实施的数据爬取,则可能构成不正当竞争或非法获取计算机信息系统数据罪。就立法而言,当前《反不正当竞争法》对数据抓取行为是否构成不正当竞争的规定比较模糊,对于数据抓取行为违法性标准的规定亦较为欠缺。加之,经济法在内容上缺乏程序立法、缺乏对执法部门的权力制衡,由此造成执法队伍难以把握《反不正当竞争法》的原则内涵、政府对互联网经济过度干预、阻碍互联网技术创新和经济发展的现实困境。
《反不正当竞争法》第12条所设立的互联网专条在制定之后基本就被束之高阁,司法实践仍然经常诉诸《反不正当竞争法》一般条款,以相关行为是否“扰乱市场竞争秩序,损害其他经营者或者消费者合法利益”作为裁判依据。增设互联网专条的目的,不是将所有通过网络平台实施的数据竞争行为纳入竞争法规制,而是考虑到互联网技术与创新商业模式的快速迭代,原有竞争法条款无法涵盖互联网数据竞争的范畴。因此,出于立法体系初衷的考量,互联网专条应体现立法的针对性与必要性。然而,互联网专条并未明显体现出数据竞争与传统竞争模式之间的共性及个性,目前列举类型所归纳的三大互联网不正当竞争行为,在网络平台竞争环境下不具有互斥性,同一竞争行为通常同时符合多个类型条款的表述。也正是因为互联网专条对于数据竞争行为的类型化表述较为宽泛,法院援引法律依据审理互联网竞争案件时,出现了对互联网专条兜底条款与一般条款进行“混搭适用”的情况。
(二)数据抓取行为所涉的竞争关系认定标准模糊
2009年最高人民法院于“海带配额案”中明确了一般条款适用的三要件,具体为:第一,行为确属法律未特别明确;第二,其他经营者的合法权益确因该竞争行为而受到了实际损害;第三,该种竞争行为确因违反诚实信用原则和公认的商业道德而具有不正当性或可责性。此三要件在一段时间内成为了类型案件判决的关键指引,但随着数字经济的持续升温,数据抓取案件对该三个构成要件的具体适用提出了新的挑战。首先,竞争关系的判断是援引《反不正当竞争法》调整市场行为的前提要件,但是互联网竞争领域的竞争关系判定更为复杂。在谷米与元光不正当竞争纠纷中,被告主张双方软件不存在收益情况,因此不存在所谓的“竞争”。但是,法院指出,竞争关系的存在不以双方所提供的商品或服务是否具有营利性为标准。这说明,不同于传统市场经济,跨界竞争是互联网的主要竞争模式,竞争关系的含义本身已经脱离狭义的竞争范畴,成为一种覆盖整个网络市场的统合型竞争。因此,以商品或服务的实际金钱收益为标准认定数据企业间是否存在竞争关系已经滞后。
其次,1993年《反不正当竞争法》和2019年新修订的《反不正当竞争法》均有关于“其他经营者”的规定,但是,此用语是否仅限于“竞争对手”,是否将经营者之间存在竞争关系作为认定不正当竞争行为的前提,实务和理论界并没有达成共识。广义的竞争关系判定主要考虑经营者之间的业务范围是否满足重叠性、吸引或争夺的消费群体是否一致、是否能以不正当方式减损其他经营者同性质的市场竞争优势地位。然而,数据抓取问题面临的竞争关系界定,需要在此广义竞争关系上进行一定缩限。
从数据的产生方面看,数据企业或数据抓取企业在初生阶段即可快速收集用户数据,加之数据存储和分析所需要的技术工具都可从众多第三方渠道获得,由此,数据的生产和分销边际成本几乎为零;且数据的聚合本身并不产生价值,企业数据抓取行为的目的或产生交易价值的渠道在于数据的后续运用。所以,数据抓取竞争关系的判定,应更多聚焦在数据抓取之后对于数据的具体运用模式和运用效果。
(三)数据抓取行为所产生的竞争损害判断逻辑不清
数据市场竞争具有强烈的对抗性,而竞争与损害相伴而生。在平台竞争中,夺取他人市场或者客户并不直接构成侵权,市场或客户群体并非当然属于原告,因此并不存在所谓“竞争侵权行为”。数据领域的竞争损害,仅在特定条件下才可能达到需要法律救济的程度。然而,当前立法对于数据领域的竞争损害判断的规定较为模糊,致使司法实践出现“以损害存在”倒推“竞争行为具有不正当性”的情形。以大众点评诉百度案为例,百度运用数据抓取技术收集整合用户发布于大众点评软件中的商户点评信息,并显示在百度地图上。法院认定该竞争行为具有不正当性的依据有两个:一是所抓取的点评信息是大众点评软件竞争力的核心,因此抓取行为对大众点评会造成竞争损害;二是百度的数据抓取行为对大众点评造成了完全、实质性替代等因素。与此相类似,在阿里巴巴与南京码注、微博与饭友案中,法院认为被告竞争企业在进行抓取数据之后,将数据内容独立呈现及应用于其他行业,构成对原告数据功能的部分替代而致使用户分流,由此推导出被告竞争行为具有不正当性。这种司法裁判现象一方面反映了具体判决指引的缺位,另一方面,此种判断逻辑实际上是在事实上把对商业模式、商业机会等竞争优势的保护,上升到类似于“商业资产专有权”的保护程度,以“法益遭受侵害为前提”来倒推判断数据竞争行为的正当性。
讨论数据抓取问题,无法避开的一个经济学概念就是“搭便车行为”。搭便车行为较为常见的表现是在一方经营者的商业模式取得成功后,其他经营者没有付出成本投入,直接模仿和借鉴其成功商业模式或者要素,以相同或相类似方式夺得竞争优势的行为。在法经济学领域,搭便车行为最常见的探讨存在于商标假冒问题,因为假冒行为直接采用现有品牌及其成熟市场,以具有混淆性的替代性产品进行盈利。数据抓取问题比之于假冒行为,有相似也有不同。相似点在于,二者在实质上都违背了竞争环境下的诚实信用原则,且对于消费者来说都存在一定误导性,在假冒产品上使消费者误认为是品牌商生产的产品,在数据抓取问题上使消费者误认为是先数据占有者产出或经营的相类似服务和产品。不同点有两个方面,一是是否会造成市场代替的结果。假冒产品,以奢侈品为例,并不一定能够产生市场代替的效果,因为正品和假冒产品的市场群体并不重叠,在相关市场的判定上正品和假冒产品并不相同。针对数据领域,容易造成市场代替结果的不正当竞争行为是通过数据抓取和分析进行“流量劫持”,违背用户意愿并强迫其访问,从而造成原网站平台流量损失。“流量劫持”产生市场代替的效果一方面是因为此类平台的经营模式、核心竞争力主要靠流量广告交易产生盈利,因此劫持流量相当于直接劫持了对方收入;另一方面是因为此行为没有提供任何新产品或服务,单单造成了客户群体的转移,从而构成不正当竞争。
综上,传统经济学中搭便车理论虽然对数据抓取竞争行为的正当性分析提供了一定的理论基础,但是其对于平台数据竞争的固有特征缺乏考量。互联网数据抓取行为在很大程度上的确具有搭便车行为的典型特征,但是抓取行为所产生的具体竞争效果或损害,不可一概认为就与传统搭便车一样“损害竞争”。对于数据抓取行为可能造成的具体损害应充分考虑数据竞争行为是否产生实质性的替代效果。
(四)对限制数据抓取可能造成的数据垄断缺乏应有的关注
从消费者利益的角度出发,竞争法制度所鼓励发展的产业形态特征是能以更低廉的价格为消费者提供更优质的服务,由此,企业数据创新最直接的体现即为社会和消费者提供多样且免费的数据技术相关服务,在此过程中应当允许数据企业在其业务生产链中通过获取和分析数据进行获利。应当意识到,企业所获取的用户数据具有非竞争性,换言之,没有任何数据企业能够“控制”大量数据,并不存在所谓的“数据企业利用自身数据能力来巩固自身市场主导地位”这一说法。如果经由反垄断法直接介入为竞争企业作出选择,则极易威胁到新产品和服务的创新。且从另一个角度看,平台市场竞争的动态环境并不会向数据主导型大企业倾斜。因为数据产品差异性大,不同数据产品能够提供的服务在类型、针对性和服务体验等众多方面都存在不同程度的差别。若无强有力的证据表明企业竞争行为存在排除或限制竞争影响,过于积极的反垄断立法或司法只会阻碍竞争并抑制创新,从而损害消费者福利。
当前,司法实践在维护数据流通与垄断之间的平衡方面存在短板。如在百度诉360案中,百度限制360对其旗下包括百度百科、百度知道在内的内容服务网站进行数据抓取。法院认为本就具有市场优势地位的百度公司利用多个相关市场的联合扩大了自己的竞争优势,基于此360的抓取行为具有不正当性。这实际上是放大了竞争行为正当性判断的边界,预设了数据经营者利用“在先垄断”为自身创设竞争优势,并将此判断纳入对手抓取竞争行为的正当性判定之中,缺乏从数据抓取行为本身出发分析论证行为正当与否。背后反映出《反不正当竞争法》和《反垄断法》在具体数据抓取问题上的适用分界并不清晰。
《反垄断法》以经济政策为导向,保障市场主体自由竞争,预防和制止垄断行为;《反不正当竞争法》以公认的商业道德为依托,调整市场主体采用不正当手段进行竞争的行为,二者在立法目的与调整范围上均有所不同。传统反垄断法定义相关产品或服务市场时,除了需要从消费者的角度考虑哪些产品或服务会被消费者视为可互换或替代,还要考虑消费者的实际偏好和功能上的可互换性。然而,定义互联网产品和服务的相关市场比较特殊。一方面,数据的产生缺乏成本,但是大多数反垄断规制中关于市场和产品的分析模型主要都基于价格,因此,价格模型对于数据市场的分析可能并不适用。另一方面,竞争规制分析中关于“消费者是否可以有效地获得替代品”的问题,主要考虑“地理市场”的定义。在传统产品及服务业中,地理市场受到运输成本、消费者地区偏好以及语言障碍的限制,且消费者自身所处位置也将决定当地的产品需求量和价格。不同于此,数据市场具有全球性,大多数基于平台提供的服务和产品不受技术或地域标准限制皆具有全球性,并且通过数据抓取所分析出的大部分用户习惯和喜好在全球范围内很有可能具有普适性。因此,目前全球范围内的竞争监管机构和法院皆未明确定义数据行业的“市场”。
欧盟委员会在2014年Facebook收购网络聊天平台WhatsApp案件的审查中,为数据行业的排他性竞争行为提供了比较具有参考性的分析框架。在数据竞争环境下,掌握较大数据量的成熟型数据企业在获得一定网络效应或网络影响后,可能会阻碍其他后续竞争者进入此领域。但是,Facebook与WhatsApp的收购交易不太可能增加其他竞争者参与该领域市场竞争的难度,因为,第一,“消费者可以同时使用多个应用程序并且可以在不同软件之间轻松切换——目前有大量的市场竞争参与者与Facebook一起收集用户数据,包括Google、Apple、Amazon、eBay、Microsoft、Yahoo、Twitter、LinkedIn、Adobe和Yelp”。换言之,欧盟已经明确即使Facebook开始从WhatsApp用户处收集数据也不会造成竞争损害,因为除了此二者合作产出的数据之外,数据平台竞争环境下仍有海量数据并不在Facebook的控制范围内,这些数据还有着巨大的广告意义和竞争潜力。第二,由于Facebook和WhatsApp均未积极向第三方提供用户数据、没有活跃于任何此类潜在的数据交易市场,因此,欧盟无法在此情况下定义“大数据市场”或“数据分析服务市场”。
结合当前域外竞争法对于数据抓取问题的规制看,法律虽限制具有市场支配地位的竞争者滥用自身所具有的优势地位,但并不要求其与其他竞争者共享数据。与此同时,目前,国内司法实践中的数据垄断纠纷案例也较为罕见。在数据产权及流转规则都不明确的情形下,很难认定平台企业独占数据且构成垄断并以此作为数据不正当抓取的抗辩。最终判断抓取行为是否构成不正当竞争,仍应回到上述部分所分析的诸如数据竞争模式、抓取行为本身是否带动产业创新,以及数据产品最终产生价值的方式上。此外,如果被抓取数据平台没有达到传统反垄断法对于垄断的判断条件,其限制数据抓取和流通的行为也应被认定为构成不正当竞争。
四、竞争法规制数据抓取的优化路径
数据作为平台企业竞争的核心资源,无论在当前立法框架下相关数据是否已明确构成一种被法律保护的企业财产权利,由于数据竞争行为关乎公平竞争秩序,因而相关竞争行为都能在反不正当竞争法中找到调整、适用的空间。同时,数据平台市场秩序具有时代性,其随着技术和服务模式的升级而改变。如何理解平台数据产生和运用方式的特点、如何评估数据抓取行为对于平台核心竞争力的影响,以及如何实现竞争法上涉及数据抓取的多方主体间的利益平衡,都对数据抓取问题的不正当竞争规制提出了新的挑战,亦为完善平台数字经济的法律规制提供了契机。以数据抓取行为特点为基础,以下尝试针对数据抓取行为的不正当性判断标准提出相关考量因素,厘清其与限制数据抓取行为的合法性边界。
(一)数据抓取行为不正当性的判断应考虑数据核心竞争力和创新模式
数据不正当抓取的行为模式具有一定的共性。首先,被抓取数据及后续产出应具有商业价值。数据的商业价值产生于流通环境下被用于具体产品、服务的开发和创新,因此,平台数据共享决定了数据在开放流通的情形下可达最优效益。数据虽无明确的界权,但可以经营者贡献、数据的开放程度来认定经营者是否对数据享有财产性权益。其次,数据抓取行为存在规模性与技术突破性。具有一定规模性的数据访问方式可能造成网站运营的超载,影响经营者的正常经营活动。当前市场中,数据经营者出于稳定性、安全性、保护自身数据财产性利益的考量,一般会对产品采取一定的限制抓取技术措施,诸如验证码、注册访问制、IP访问频率检测、请求时间窗口过滤统计等。因此,在判断数据抓取技术是否突破合理限度时,应关注被抓取数据的类型以及经营者是否采取限制措施。最后,数据抓取行为的损害结果应具有可责性。数据抓取行为的可苛责性不在于造成其他经营者利益的减损,而在于行为越过诚实信用与商业道德,或在客观行为层面采用了法律禁止的误导或欺诈等行为方式,且最终造成了市场竞争秩序的扭曲。这主要包括抓取有技术措施保护的非公开数据、对抓取数据未作处理且在相同或相近领域直接商用以及其他违反行业惯例的数据抓取行为。
在提炼出数据不正当抓取的共性的基础之上,不正当性判定应综合考虑平台数据竞争行为的创新模式、所抓取数据的价值及其创新目的以及抓取所产出的数据类产品是否能丰富产品多样化这三个要素。当前,反不正当竞争司法实践在面对数据抓取等互联网竞争纠纷时,以“竞争优势遭受损害”作为“行为正当与否”的论证基础,带有明显的“权利侵害式”侵权认定之迹象,在扩大了反不正当竞争法规制范围的同时也忽略了平台数据竞争的固有特征。数据抓取行为实质是对用户访问行为的一种拟态,是大数据时代解决数据筛选、信息过滤的必然产物。如果抓取行为与用户访问行为无异,仅访问平台的表层数据,则其不正当程度较弱;如果绕过技术保护措施、造成平台数据负载过大、采用法律所禁止的具有系统破坏性的技术等方式、数据抓取的后续应用并不产生任何产品或服务上的创新,则不正当程度较强。同时,数据抓取行为的目的不应与市场价值观念显著背离,数据是否属于可自由流通的范畴(如商业秘密、涉黄涉暴等)、经营者数据权益的合法性基础等问题也是行为正当与否的判定关键。
因此,竞争法规制的重点是不正当行为本身,而非竞争利益的全面保护,基于此,在裁判思路上,司法实践应从传统侵权法规制思路向“行为规制”思路转变,将数据企业经营模式和平台数据的核心竞争力来源因素纳入到对数据抓取行为是否正当的判定中。
(二)在广义竞争关系下对数据竞争关系进行一定的缩限
与传统的经济行业不同,互联网行业并不具备明确的行业界限,平台经济所促成的“跨界竞争”成为最普遍、最重要的竞争模式。在此竞争模式下,平台跨界竞争以用户和数据资源的争夺为目的开展商业活动,并不具有明确的竞争对手——这种竞争对手的不确定性不仅体现在数据体量上,也体现在对手的属性与类型上。只有待竞争各方在某一时刻所争夺的用户产生交集,竞争对手和所谓“特定市场”竞争关系才会短暂明确。因此,数据领域的竞争行为与竞争关系之间不再具有传统竞争法意义上的内在逻辑联系。
在具体界定竞争关系的过程中,能够决定竞争行为会产生“以不正当方式减损其他经营者同性质的市场竞争优势地位”这种竞争效果的,是具体数据运用的模式。值得注意的是,数据的自由流通和抓取行为能够经过后续分析而产生新产品,源于数据的非排他性、非竞争性,以及上述解释的在线平台所具有的高度差异性。数据企业通过抓取行为收集数据,并不会以另一企业的竞争资源为代价。同时,从数据用户的角度看,“多重归属性”是数据平台的服务常态,即数据用户可在平台上自由支配其数据、使用多个不同平台服务提供商来提供不同服务甚至同一服务。目前通过数据抓取提供服务的数据平台,对用户数据并没有明确的或事实上的独占或排他性占有权或所有权,且就用户服务条款而言,也没有任何定价结构或法律强制性规定要求数据用户仅可与一个数据平台共享数据。而从平台数据竞争的角度看,用户数据的“多重归属性”可以在一定程度上维持数据企业间市场竞争力的平衡。
另外,从产品和服务的角度看,数据平台本身其实具有高度的差异性,即使提供相同类型服务的平台亦是如此,这使得经过不同平台处理所产生的数据最终被运用的方式也具有高度的差异性。即使数据企业在进入市场初期采用的是数据抓取手段,随着其逐步开拓自身数据市场,最终成为其核心竞争力的数据与其竞争对手核心竞争数据的区别只会越来越大,因为平台数据业态发展的趋势是提高更精确的产品及更具亮点的服务,所以,对某一个数据企业有用或重要的核心竞争数据可能对其他竞争企业来说并无太大用处。加上数据企业争夺的消费群体在很大程度上存在高度的一致性,因此,完成数据抓取行为之后,能够产出的数据类产品如何产生价值、如何被运用和消费以及如何推动产业创新,将影响竞争关系的判定。跨界竞争已经成为平台数据的主要竞争模式,竞争关系由此脱离了狭义的竞争范畴,成为覆盖平台市场的统合型竞争。对于竞争关系的界定、是否存在竞争关系,个案中应回归数据本质及特点,从数据抓取方的具体数据运用模式、数据新产品价值、运用和消费方式以及推动产业创新角度对广义竞争关系进行一定的缩限。
(三)竞争损害判定应考虑数据经济特征和市场替代效果
对于市场替代效果的判定,竞争法在数据抓取问题上应首先加入数据自带的经济意义考量。目前,数据经济因素对于平台经济创新和对自由竞争的影响在竞争法规制中并没有很好的体现。以数据平台为代表的数据驱动型市场通常以低准入门槛为特征(low barriers to entry),而这一经济特点深刻影响着数据竞争的模式。低准入门槛意味着对于新进入数据竞争市场的企业而言,其参与数据竞争所需要的数据量、数据质量,都没有成熟型企业要求高。大部分通过数据抓取手段实现的在线服务,在启动之初所需要的用户数据并不多,其加入竞争的方式是通过推广其能够满足客户需求的新型产品,并在此过程中迅速收集新用户数据,然后用于数据相关产品的进一步改进和升级。从竞争模式与数据运用结果来说,这与成熟数据企业已有的数据内容和竞争方式都不冲突。因此,数据竞争的低准入门槛经济特点使得数据抓取行为在产生之时,如果只涉及竞争优势的转移,则并不必然构成不正当竞争。有可能构成不正当竞争的抓取行为应是在不具有数据产品或服务创新功能的同时实质性地替代了原产品或服务,如上文所述的“流量劫持”行为就产生了直接市场替代效果。
但并不是所有的数据抓取行为都必然导致原网站的流量损失,是否会导致原网站流量损失及产生实质上的市场替代效果还取决于第二个考量——产品差异性。在商标假冒领域,假冒产品与原产品几乎无差异,反而差异性越小越能起到混淆的作用。但是,在数据领域则不同,正如上文所分析的数据行业准入门槛低和数据寿命短这类特点,差异性小的数据产品或服务在数据行业不具有任何竞争性。只有辨识度大的数据信息、与数据消费具体服务相关度高、更新及时的产品才能具备独特的竞争优势。举例来说,美国司法部和审判法院均认为,针对数据产业的同行业收购行为,如果企业合并之后提供几乎完全相同的服务或产品,这种并购并不会为数据市场带来更好的产品、向消费者提供更低的价格,也不会实现数据平台产业中更有突破性的创新。与这类无意义数据企业并购相反的是“数据驱动型创新理论”:Microsoft和Yahoo!在2010年提出建立与搜索引擎功能相关的数据功能合作关系,美国司法部认为,Microsoft获取更多数据信息后将可对其搜索产品进行更快速、及时的改进,这将加大Microsoft的竞争优势,进一步生产出Google的竞争替代产品,能够提高数据驱动型效率。因此,数据抓取行为如果能够产出或提供具有数据创新型的产品,也就实现了在自由竞争框架下的产业创新,不需要论证是否会产生市场代替效果。
再进一步,在具体判定实质性替代的过程中,应包括几个更具体方面的考量。第一,被抓取的数据是否已经累积到一定程度的规模效应。第二,数据抓取后所产生的商业价值是否有利于自由竞争秩序的形成。第三,允许数据抓取所保护的单向数据经济利益是否符合市场整体创新利益。如在大众点评网与网易的移动客户端“饭饭”纠纷中,大众点评认为“饭饭”抓取其商户信息、人均消费价格等具有大众点评网特色的数据。从数据规模的积累方面看,大众点评平台的用户点评信息可以认为是其核心竞争优势资源,其付出大量时间和资金从用户中收集。从商业价值看,其商业模式的服务目的是帮助平台用户在同类商家中优化选择。而从自由竞争秩序和市场整体创新角度看,“饭饭”平台通过抓取大众点评数据所产出的服务与大众点评(原告)无异,其竞争行为除了减损对手经济利益外对于数据市场的服务和产品创新并无贡献。因此应认为二者存在竞争关系且实质上代替了大众点评向用户提供的服务。
除此之外,通过实质性替代判断抓取行为是否产生竞争损害,也是源于数据抓取行为本身的经济意义——被抓取的数据寿命有限(short-lived),随着时间的推移,数据价值会大大降低,通过数据抓取所获得的任何竞争优势都是短暂的。从竞争方式和竞争结果看,掌握大量陈旧或通用型数据并不一定会使成熟型数据企业或数据经营方获得绝对的竞争优势,也不会使新数据企业或数据抓取方处于绝对的竞争劣势,因为数据市场真正需要的是有区别、有辨识度的数据信息。因此,纳入数据和抓取行为的经济意义考量,即明确了数据抓取竞争行为应实现的创新目的:并非创建“等同于竞争对手所享有的数据规模”,而是通过数据抓取这一技术手段积累高度相关、更新及时的数据,形成自身独有的竞争特色和优势。这也是数据竞争法所应关注和鼓励产生的动态数据经济效益。
(四)限制数据抓取的抗辩与抓取合理限度的设定
从竞争形态上看,数据成为平台企业核心竞争资产这一现象说明,平台企业所掌握的用户数据数量,与其在平台竞争中所能取得的竞争领先优势成正比。基于此,从竞争手段上看,如果从非静态数据库中抓取数据,通常情况下抓取方均认为数据具有一定的共享性质,并以此作为抗辩,主张被抓取方限制对手抓取数据的行为构成数据垄断。数据作为平台核心竞争要素,的确存在像其他竞争资源一样的垄断可能性。因此,在判断数据抓取方是否可以针对被抓取方的限制抓取行为援引“数据垄断”作为抗辩,可考虑结合欧盟2020年《数字市场法案》(Digital Markets Act)中的“守门人标准”,同时分析其他竞争者参与该领域数据市场竞争的难度。
垄断的本质描述的是一种竞争状态,在数据领域形成此种状态之后其他竞争对手需要付出更多时间和成本才能获得同样的数据体量。此时优势方,通常也就是被抓取方,会利用这个差距优势进一步拉开竞争差距。但是,如果限制抓取或拒绝分享数据的行为并不影响参与竞争的其他同类数据的广告意义和竞争潜力,则不必然构成数据垄断。针对限制抓取行为,若以“数据垄断”作为抗辩,则应首先判断是否形成反垄断法意义上的数据垄断地位,而此处,传统反垄断法主要采用的“市场支配地位”标准在数据问题上适用比较困难,因为如前所述,数据市场的定义与传统行业相比存在较大的不确定性。《数字市场法案》中的“守门人标准”具有一定的参考性。
欧盟《数字市场法案》侧重解决平台企业与平台上经营者的公平竞争问题,将达到一定业务规模的极少数超大型数字平台企业认定为“守门人”(gate-keeper),对其适用最严格的竞争监管规则,建立公平的竞争环境,以促进数字经济市场的创新、增长和竞争力。所谓“守门人”,是指在营业额、用户数或市值达到一定规模,并且在至少三个欧洲国家提供平台服务的企业。这些“守门人”有可能对数据流通产生影响、其经营着多个与消费者直接接触的重要渠道、在经营中享有或预期享有牢固持久的市场地位,企业间数据流通和竞争皆需要依赖这些“守门人”,因此,其不公平行为可能加剧现存的数据行业壁垒,对行业的公平竞争产生负面影响。具体来说,该法案规定,“守门人”应允许数据企业用户在其平台以外的其他平台推广产品并签订合同;应允许用户访问在使用其平台时所产生的数据;不得以收集数据的方式与对手竞争。同时,该法案并不影响欧盟成员国竞争法的实施,只是在竞争法无法有效规制的情况下才会对其进行补充规制。由此可见,《数字市场法案》要解决的是经济不平衡问题、“守门人”的不公平商业行为和由此带来的负面后果,比如平台数据市场的竞争力减弱问题,这恰好与数据抓取问题不谋而合。
其次还应结合其他同类数据的竞争潜力、他人获取同类近似信息的可能性,以及相关数据产品对于此数据的依赖程度予以考虑。同时应认识到,即使成功援引数据垄断作为抗辩,也不能就此认定或倒推数据抓取行为具有不正当性。最终判断数据抓取行为是否构成不正当竞争,仍应着眼于上述部分指出的诸如数据竞争模式、抓取行为本身是否带动产业创新,以及数据产品最终产生价值的方式。更重要的是,如果援引数据垄断作为抗辩不成功,限制抓取方没有形成反垄断法意义上的数据垄断地位,则其限制竞争对手抓取其数据的行为也可能构成不正当竞争。
最后,互联网数据经济语境下的竞争,旨在确保企业的自由、消费者的选择,以及保护和增加创新潜力。然而,传统反垄断法理论中的“消费者福利”理论已经受到平台数字经济模式的挑战。反垄断法的传统理论对创新的直接关注相对较少,主要以价格和产出这种静态效率作为衡量标准来考察消费者福利的增减。但将这种静态衡量标准应用在平台数据竞争领域,则会忽略数据竞争和平台经济所具有的动态创新效率。竞争必然带来商业利益或交易机会的得失,而竞争法调整的范围应当限定在“不正当行为”的范围内,根据不同市场参与者的不同竞争利益来分析判断,并无固定不变的价值位阶和权重。因此,可同时考虑引入以效率为价值取向的多元利益动态权衡分析模式对上述考量因素进行整合,横向上综合考量自由公平竞争秩序、竞争行为正当性、消费者选择是否能实现多样化等多元价值和目标,纵向上综合考量整体数据经济利益、市场竞争利益以及竞争者个体利益的动态平衡,划出数据抓取行为正当性与非正当性的边界。
五、结语
数据已成为平台经济产业内最重要的竞争资源与生产要素。面对数据抓取行为所带来的立法与司法双重挑战,《反不正当竞争法》互联网专条、一般条款,甚至《数据安全法》,皆未能很好地回应数据抓取问题。当前数据抓取等互联网竞争纠纷的司法实践多以“竞争优势遭受损害”作为“行为正当与否”的论证基础,带有明显的“权利侵害式”侵权认定之迹象,在扩大了竞争法规制范围的同时也忽略了数据竞争的固有特征。不正当竞争行为的本质,是其客观造成了市场机制的扭曲,破坏了市场结构。因此,竞争法规制的重点是不正当行为本身,而非竞争利益的全面保护,裁判前提应是竞争行为因客观上扭曲了市场机制而需要法律加以修正,并非具体权益遭受侵害而需要法律保护。基于此,在裁判思路上,司法实践应从传统侵权法规制思路向“行为规制”思路转变,将数据企业经营模式和平台数据核心竞争力因素纳入数据抓取行为正当性判定的考量范畴。
不正当竞争行为的本质,是其客观造成了市场机制的扭曲,破坏了市场结构。因此,竞争法规制的重点是不正当行为本身,而非竞争利益的全面保护,裁判前提应是竞争行为因客观上扭曲了市场机制而需要法律加以修正,并非具体权益遭受侵害而需要法律保护。基于此,在裁判思路上,司法实践应从传统侵权法规制思路向“行为规制”思路转变,将数据企业经营模式和平台数据核心竞争力因素纳入数据抓取行为正当性判定的考量范畴。