作者简介:孙益武 杭州师范大学沈钧儒法学院副教授、法学博士
摘要:虽然数据一直客观存在,承载并记录着人类活动的各种信息,但其被广泛接受还是作为计算机专业术语被使用;从二进制的存储到法律规范中信息的多维表现形式,作为承载知识产权、商业秘密或个人信息的数据受到相关法律的特殊保护,呈现出垄断的部分特征。然而,数据本身的权利配置并不明晰,平台经营者通过反不正当竞争等形式保护其数据优势,合法占有的公共数据也呈现出垄断的特点,其商业开发和利用存在制度困境。针对平台经济的反垄断审查,不应关注数据数量上的多寡,其重点应在行为的垄断性,即数据收集、处理行为有无非法性,有无数据垄断协议或算法上的共谋等利用数据优势排除或限制竞争的行为。
关键词:反垄断 数据 平台 算法
2020 年 11 月 10 日,为预防和制止平台经济领域垄断行为,引导平台经济领域经营者依法合规经营, 国家市场监管总局发布《关于平台经济领域的反垄断指南(征求意见稿)》并公开征求意见。2021 年 2 月7 日,国务院反垄断委员会正式印发《国务院反垄断委员会关于平台经济领域的反垄断指南》(文中简称《平台经济反垄断指南》)。在《平台经济反垄断指南》中“数据”一词出现多达 18 次;其中,第二章“垄断协议”中 5 次,第三章“滥用市场支配地位”中 6 次,第四章“经营者集中”中 7 次。在反垄断处罚措施中, 对于不予禁止的经营者集中,反垄断法执法机关甚至可以附加剥离数据无形资产和强制开放数据的结构性条件或行为性条件。数据成为平台经济反垄断执法中的关键因素。
谁都无法否认数据的竞争影响力及其可能带来的市场优势地位;但是数据收集并不具有独占性,其市场准入门槛也并不高,大数据规模效应并不必然导致平台企业滥用市场支配力量。拥有海量数据本身并不构成垄断,非法利用数据的行为可能构成垄断,例如采用合谋算法等形式的经营者垄断协议。
学界对数据相关的反垄断问题有不少关注,有的讨论“数据垄断”的基本问题,有的侧重数据竞争的案例分析,有的关注大数据价格歧视行为,有的研究数据相关市场及市场支配地位的认定,但现有研究都没有注意数据本身的法律性质及其合法形态,本文着重论述数据的多个面向,以及法律规范对数据及其衍生品的保护,最后结合《平台经济反垄断指南》中重点规制的行为类型,评析竞争和垄断评估中的数据因素。
一、数据的多维面向:从计算机术语走向法律文本
(一)数据术语的迁移
在计算机术语中,数据(data 为复数,单数形式为 datum)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。数据可以是连续的或离散的值,前者如声音、图像等模拟数据,后者如符号、文字等数字数据。数据通过位和字节等计量单位来衡量;“位(bit)”是电子计算机中最小的数据单位;并且 8 个二进制位构成 1 个“字节(Byte)”是计算机存储空间的基本计量单位。
法律术语中“数据”的含义需要结合立法目的、文本和上下文做出综合认定。例如,《民法典》承继《民法总则》第 127 条的表述,即“法律对数据、网络虚拟财产的保护有规定的,依照其规定”,第 137 条还涉及“数据电文”的意思表示。再如《电子商务法》第 25 条关于经营者的信息提供义务:有关主管部门依照法律、行政法规的规定要求电子商务经营者提供有关电子商务数据信息的,电子商务经营者应当提供;第69 条关于促进电子商务的条款中规定:国家维护电子商务交易安全,保护电子商务用户信息,鼓励电子商务数据开发应用,保障电子商务数据依法有序自由流动。《电子签名法》第 2 条界定“电子签名”是指数据电文中以电子形式所含、所附用于识别签名人身份并表明签名人认可其中内容的数据;而数据电文,是指以电子、光学、磁或者类似手段生成、发送、接收或者储存的信息。可见,在法律文本中,法律保护的往往并不是二进制数据本身,而是数据所表达或传递的信息。这种信息对于法律主体来说,有人身性、稀缺价值或有商业价值。信息的数据存在多种表述上的混同,在不同的纠纷场景中,根据当事人利益的侧重点、具体诉求的性质和救济的方式不同,有纯粹信息问题、纯粹数据问题和混合问题。
在反垄断法语境下,合法持有数据再多本身不可能构成垄断。根据媒体报道,脸书有 20 亿用户,存储超 300 千兆字节的数据。尽管美国政府有意对 GAFA(谷歌、亚马逊、脸书和苹果)进行反垄断调查,但不因它们数据量巨大,而是基于其数据而作出法律禁止或限制的其它行为。如果仅因数据资源丰富而被责罚,则构成对数据要素的歧视。
数据存储容量巨大本身并不是“大数据”。通说认为“,大”是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。但大数据不简单等同于海量数据,其基本特征除了体量大(Volume)之外,还包括多样性、价值密度低、速度快等特性。假设公安人口数据库中,只有姓名、身份证号、性别等几个字段,但记录有 14 亿条之众,体量足够大,当没有与其它数据库进行关联或映射,其作为大数据的意义并不充分。
(二)知识产权法保护的数据
在知识产权法语境下,作为大数据产品形式存在的数据库受到著作权法或数据库保护单行法等法律规范的保护。1996 年 WIPO 互联网条约之一《世界知识产权组织版权条约》规定:“数据或其他资料汇编,不论用任何形式,只要由于其内容的选择或编排构成智力创作,其本身即受保护。”我国《著作权法》也规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”也就是说, 只要在数据组成材料的选择或编排上具有独创性,就可受到著作权法的保护。
从大数据和数据库二者关系来说,二者范围大致是互相重合的。大数据可能是一个或多个数据库构成,而数据库是按照特定的顺序或方法排列,并具有相互联系的数据信息的集合体(大数据)。离开组成数据库的信息材料(数据),就无法形成数据库;如果汇编的信息材料是受版权保护的数据,数据库的权利人在制作数据库时要获得著作权人的同意。如果汇编内容包括以非著作权材料为内容的数据库,其中非著作权材料如果涉及个人隐私或其它财产权利,数据库汇编人也需要取得相关权利主体的同意;例如《网络安全法》中所确立的个人信息收集的知情同意和最小化收集原则等。
数据库著作权保护不延及数据库的内容,著作权法对数据库保护的是对其内容的选择或者编排体现独创性的表达,而不是它所选择或编排的内容本身。因此,数据库著作权保护不延及数据库的内容。数据库著作权保护也不延及操作数据库的计算机软件程序(例如 oracle 或 excel);数据库和操作数据库的计算机程序是两个独立的著作权保护对象。
知识产权本身是对信息和数据编排与表达的合法垄断。有人说,数据是 21 世纪的石油。石油也好,能源也罢,如果数据存储在那里,没有得到充分利用,并没有发挥价值,徒增存储和维护成本。相对于杂乱无序的原始数据,运用大数据的理念开发出的数据衍生品具有更高的意义和价值。如果数据汇集构成数据库作品,依据著作权法基本原理,这些作品在一定程度和形式上构成合法垄断。
(三)个人信息保护中的数据
网络平台经营者累积的大数据中有一部分是个人信息有关的敏感数据,即,个人信息(个人数据)。欧盟《通用数据保护条例》(GDPR)中使用“数据主体”(data subject)的概念来指征个人是含有个人信 息数据的权利主体。有趣的是“data subject”(数据主体)一词在 GDPR(含序言)中共出现 88 次,但没 有在第 4 条定义中明确单列解释,而是在“personal data”(个人数据)这一术语中被间接地说明。原文为 “‘personal data’means any information relating to an identified or identifiable natural person(‘data subject’)”;因此可反推出:数据主体应为根据个人数据信息已识别或可识别的自然人。由于我国实行网络实名制、快 递实名制等一系列安全管控措施,提供个人信息成为网民享受网络服务的前提。因此,尽管网信办拟规定部分移动互联网应用程序(APP)无需收集个人信息也可提供网络服务,⑦但 APP 中强制授权、过度索权、超范围收集个人信息的现象密集涌现,个人信息安全保护形势依然严峻。
网络平台的大数据中也存在大量非个人信息,特别是不含个人信息的浏览记录、交易记录等;比如, 实践中大众点评网的点评留言数据、豆瓣网上的书籍或电影评分数据。这些数据在通过一定的关联分析也可识别出数据主体。这也是“数据画像”(data profiling)作用之所在,它是精准营销和大数据杀熟的基础。然而,我们假定这些交易数据已经匿名化和脱敏处理,非个人信息数据的权利主体是否为网络平台经营者 ? 网络平台通过用户协议等声明对这部分数据的所有权或控制权,司法实践也支持平台这部分数据的财产性收益。
(四)数据优势和数据垄断
无论是构成数据库等知识产权客体的数据,还是作为精准营销基础数据的个人信息,无论是网络平台经营者还是平台内经营者,掌握大量数据的主体往往会比竞争对手获得比较优势。
中国共产党第十九届四中全会提出“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”,这既是对数据在数字经济中所起的关键作用的肯定,也是承认数据价值的比较优势。《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》把数据作为一种生产要素单独列出,反映了数字经济的时代特征;并从推进政府数据开放共享,培育数字经济新产业、新业态和新模式,以及加强数据资源整合和安全保护等三个方面加快培育数据要素市场。这些顶层设计也在《海南自由贸易港建设总体方案》和《深圳建设中国特色社会主义先行示范区综合改革试点实施方案(2020-2025 年)》等地方方案中得到落实和体现。
如果把数据类比成一种原材料,产业链上包括原始数据提供者、数据收集(处理)者、数据产品的销售者和消费者等;其中,最为关键的主体是数据的收集者和处理者。虽然数据提供者作为提供原始材料的角色,不可或缺;但单个数据的价值十分有限,而规模化的生产和应用有赖于大数据的分析和挖掘,以及数据衍生品的设计和生产。因此,技术强大的网络平台一旦掌握丰富的数据资源,他们往往容易对其它竞争者形成碾压态势,使自己在竞争中取得优势地位。网络平台的数据优势容易转化成市场占有率的提高、合作机会的增加、成本的降低与利润率的提高等其它竞争优势。
因此,反垄断法应当关注数据对于参与市场竞争是否不可或缺,数据是否存在其他获取渠道,数据开放的技术可行性,以及开放数据或独占数据对其它经营者可能造成的影响等因素。从竞争者角度考虑,其他经营者获得数据等必要资源和必需设施的难度,并从用户多栖性、数据获取成本等方面评估经营者数据获取的可能性、及时性和充分性。从消费者或用户角度,考虑提供数据的自愿性、数据迁移的转换成本等多方面因素。
二、数据要素的权利配置
(一)关于数据所有权的争论
赫拉利说:如何规范数据的所有权?可能是这个时代最重要的问题。马普创新与竞争研究所却认为:没有理由赋予数据所有权。⑨在中国的诸多地方实践中,早早成立数据资源管理机构。在条块分割的行政管理体制中,数据似乎找到可以依靠的“监护人”。然而,数据资源管理部门无法管理个人信息数据和企业的数据,也不能管理各行各业的公共数据,例如公安部门有人口基础信息、车辆注册信息,卫健委有健康医疗数据;各地的“城市大脑”和“一网通办”要求政府部门把公共数据汇集到当地的数据平台。
首先,个人信息数据是构成一切数据源的基础。个人信息数据的不当披露和使用会损害数据主体的个人隐私和财产性利益。《民法典》将个人信息保护置于人格权编隐私权一章,考虑到个人信息对隐私权保护的影响。但从财产利益保护的角度,个人隐私的“价值”越高,则网络平台收集数据的获利能力越强。因此,作为数据主体的个人信息提供者首先在数据所有权的确立上存在巨大障碍。按照数据参与分配的理论,个人信息主体应当作为第一环节的分配主体参与数据要素的收益分配。尽管不少学者证成个人信息权的正当性,但仍存在很多理论上的分歧和实践中的争议。另外,“我的数据属于我”(My data belongs to me)的主张对设定数据所有权具有误导性。按照个人信息保护法律的设想,个人信息主体的查询权、更正权和删除权是强化个人对于“他们自己的数据”的控制,并非设定一个完全具有对世义务的所有权。因为个人信息的保护和控制不仅是个体私权范畴内的意思自治,个人信息的使用也存在大量公共利益、权利限制和合理使用的范畴,个人信息社会控制的要义并不比个体隐私利益要少。况且,大多数个体为了使用网络平台的数字化服务,容易就给予必要的“知情同意”,而不会过多考虑自己被法律所维护的数据保护方面的利益。通过强化信息主体的控制权和事后救济,个人信息保护完全可以在不引入个人数据所有权的情况下实现。
其次,数据密集型产品或服务的贡献者众多,包括数据存储、清洗、挖掘等多个业务操作逻辑。当所有行为是同一主体所为时,可能权利配置争议不大;当数据操作涉及数据收集者、数据处理者、数据存储者等不同角色时,如何设定权利配置就成为难事。
再次,所有权赋予权利人行使权利的充分自由,即使用、变更、消灭以及获得所拥有资产产生收益的权利。然而,目前不论是欧盟或其成员国,亦或是任何其他的工业化国家,都不存在“数据所有权”。如果要讨论是否引入“数据所有权”,需要区分个人数据所有权与独立于个人身份识别的数据“所有权”。⑫前者已经被 GDPR 所覆盖;对于非个人数据,欧盟层面《非个人数据自由流动条例》被 GDPR 的耀眼光芒所掩盖;其立法目的是确保非个人数据在欧盟层面可实现跨境自由流动,禁止数据本地化限制;整个法律文本中暗含反对对数据赋予所有权的语境。欧盟 2020 年 11 月公布的《数据治理法》(提案)强调公共数据的重复使用和企业间的数据共享;同时,为了平衡 GDPR 中赋予个人权利,允许在“个人数据共享中介”的帮助下使用个人数据,以及出于利他理由使用数据等。这些后续立法一方面是对冲 GDPR 带来的负面影响,另一方面鉴于数据共享的跨境特性和重要性,只有欧盟级别的立法行动才能确保欧洲的数据共享模式得到推广。
我国《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》提出“研究根据数据性质完善产权性质”。因此,数据性质及相应分类成为产权配置的重要前提。作为企业商业秘密的数据已经得到法律的保护,这种保护虽然在性质上不能完全等同于所有权,但其“产权”性质得到承认和普遍遵守。
《浙江省数字经济条例》和《广东省数字经济促进条例(征求意见稿)》分别将“数据资源”定位为数字经济的“关键生产要素”;并将其界定为“以一定形式记录和保存的可机器读取的公共数据和非公共数据”。其中,广东和浙江两省都肯定基于依法获取的数据资源开发利用所产生成果(数据衍生产品)的财产权益受法律保护,可以依法交易。《深圳经济特区数据条例(征求意见稿)》开创先河,首次提出:自然人、法人和非法人组织依据法律、法规和本条例的规定享有数据权,任何组织或者个人不得侵犯。其中,自然人对其个人数据依法享有数据权,公共数据的数据权归国家所有,数据要素市场主体对其合法收集的数据和自身生成的数据享有数据权。
数据权的内容包括权利人依法对特定数据的自主决定、控制、处理、收益、利益损害受偿的权利;这种权利内容配置对应了所有权权能中的占有、使用、收益和处分等权能。深圳立法率先规定数据权引发了是否违反《立法法》等上位法的讨论,数据权规范内容是否为“民事基本制度”“基本经济制度”和“全国性事务”等这些问题有待进一步论证。《民法典》总则编第 127 条表述为“法律对数据、网络虚拟财产的保护有规定的,依照其规定”,这意味着数据规则必须通过人大立法完成,而非“行政法规”“规章”或“地方立法”代劳。
最后,即便没有法律赋予数据所有权,它的缺失并不意味着市场参与者,特别是所谓的数据生产者的利益不受保护。相反,存在反不正当竞争法等多种机制可用于保护受到威胁的数据经济利益。
(二)网络平台经营者的数据财产权益
从实践层面来看,我国法院对数据侵权与竞争的相关案例作出许多有益探索;例如,有数据的类型与权益归属,数据产品权益归属,⑲物联网数据的权益保护,⑳公共数据的合法使用与法律规制,破坏企业数据真实性与完整性,平台用户数据使用需三重授权,网络数据爬取等。24 这些案例对于非类型化的不正当竞争行为有较为深入的评析,对不正当的手段和不正当的损害建立初步判断标准。然而,即便在抛开数据权属的争议,数据竞争首先涉及用户与平台的权利(权益)边界和许可范围;其次,数据竞争正当性的判断还要从互联网或数据经济的本质即分享和利用的角度加以权衡;最后需要从反垄断层面考察数据竞争对公共利益的影响。
实践中,网络平台经营者往往通过协议的方式来约定平台收集数据的权利主体为网络经营者。例如, 新浪微博《开发者协议》专门作出约定。第 1.6 条:“用户数据指用户通过微博平台提交的或因用户访问微博平台而生成的数据。用户数据是微博的商业秘密”。第 1.7 条:“平台运营数据,是指在用户通过微博平台使用平台服务、授权网站、开发者应用期间,用户所提交的或在微博平台生成的或在授权网站和开发者应 用生成的任何数据或信息,包括但不限于用户登录数据、游戏操作数据,以及虚拟物品交易数据等数据。“平台运营数据”是微博的商业秘密。双方确认,平台运营数据和用户数据统称“数据”。25 此处暂不讨论此类协议是否为格式条款及其法律效力。
在司法实践中,人民法院支持网络经营者对收集数据的保护。在淘宝诉美景案中,27 淘宝公司是“生意参谋”零售电商数据产品的开发者和运营者,该产品通过用户在淘宝和天猫平台上浏览、搜索、收藏和交易等活动形成的数字痕迹进行分析加工,为平台内经营者的电子商务活动提供经营参考。被告美景公司“咕咕互助平台”“咕咕生意参谋众筹”网站,招揽、组织和帮助他人获取原告“生意参谋”数据产品的数据内容,并从中获益。法院认为,“生意参谋”数据产品系原告耗费人力、物力和财力,经过长期经营积累形成,数据收集、整理和使用具有合法性,原告对“生意参谋”大数据产品应享有独立的财产权性权益。被告搭便车的行为是有悖于商业道德的不劳而获,被告故意以赢利为目的分享“生意参谋”账户的行为将导致原告用户减少,对原告合法的权益造成损害,构成不正当竞争。
然而,网络平台通过格式条款确立收集者的数据财产权益存在诸多瑕疵。例如,美团用户协议第 5 条关于知识产权的规定:“美团平台服务的开发、运营、维护等过程中产生的所有数据和信息的知识产权(包括但不限于专利权、著作权、商标权及商业秘密)归美团所有。”28“数据的知识产权”表述不清,数据和知识产权也并非一一对应关系。美团点评所主张的应受保护的利益并非绝对权利,用户评论信息的收集和存储是大众点评的劳动成果。对于未经许可使用或利用他人劳动成果的行为,虽然不能当然地认定为构成反不正当竞争法意义上的“搭便车”和“不劳而获”,但是在“大数据”时代的背景下,信息所具有的价值超越以往任何时期,如果不加节制的允许市场主体任意的使用或利用他人通过巨大投入所获取的信息,将不利于鼓励商业投入、产业创新和诚实经营,最终损害健康的竞争机制。因此,市场主体在使用他人所获取的信息时,仍然要遵循公认的商业道德,在相对合理的范围内使用。人民法院试图在数据原始收集者与数据的二次开发者之间取得一种平衡。
综上,数据收集者对数据的占有是被认可的,甚至是一种合法的独占或垄断。因此,竞争者通过爬虫抓取数据或从事其它数据挖掘行为都受到严格地限制。限制除了事后司法救济之外,也包括事先的行为自律性质的共同体准则。例如,机器人协议确立普遍遵守的技术准则。机器人协议的全称是“机器排除标准”(Robots Exclusion Protocol),其本质是保护数据主机的自我预防机制。机器人协议在数据主机和搜索引擎爬虫之间建立一种沟通方式,数据主机通过爬虫协议列出允许抓取自己的页面或数据的网络搜索服务提供商名单(白名单)和禁止抓取自己的页面的网络搜索服务提供商名单(黑名单),二者可择一设置或同时适用。
中国法院没有直接回答数据或大数据产品是否为平台的财产所有权,而是间接认定:大数据产品构成竞争法意义上的财产权益,对这种权益的侵害,扰乱了市场竞争秩序,需要依据《反不正当竞争法》给予否定评价。如此,提供或持有数据的一方(网络平台),可以就开发方或第三方未按照《开发者协议》或《用户协议》约定内容、未取得用户同意,或无正当理由使用其平台相关数据资源的行为主张自己的合法权益。如此巧妙回避数据财产权的法律争议,有助于维持大数据产品开发者的创造积极性,助力产业发展。这也对学者讨论的“有限排他权”30 或“场景之下数据权益”31 理念所作的司法阐释。这与美国在多个网络爬虫案件中回避权属争议的实用主义做法如出一辙,既可以避开理论上的纠缠,又可以快速根据案情和场景来定纷止争。32 尽管有些国家通过修订著作权法为数据挖掘提供了著作权例外,但对数据挖掘主体、目的、形式及结果处理等仍然作出限制性规定。33 因此,数据收集者利用反不正当竞争法维护权利反证存在数据垄断并不成立。
(三)公共数据的权益配置
笔者并不认同前述《深圳经济特区数据条例(征求意见稿)》将公共数据界定为新型国有资产的说法,对于公共数据不论所有权形式是私有还是国有,都不适宜独占或垄断形式据为己有。
地方立法中普遍确立了公共数据的定义和分类开放原则,开放和分享应为公共数据的默认属性。例如,《上海市公共数据和一网通办管理办法》将公共数据界定为:上海市各级行政机关以及履行公共管理和服务职能的事业单位(公共管理和服务机构)在依法履职过程中,采集和产生的各类数据资源。对于社会第三方使用公共数据的需求,上海做法是将公共数据按照开放类型分为无条件开放、有条件开放和非开放三类;同样规范还体现在地方立法中等。涉及商业秘密、个人隐私,或者法律、法规规定不得开放的,列入非开放类;对数据安全和处理能力要求较高、时效性较强或者需要持续获取的公共数据,列入有条件开放类;其他公共数据列入无条件开放类。最新的地方立法对公共数据开放提出更高要求,包括按照需求导向、分类分级、统一标准、安全可控、便捷高效的原则向社会开放公共数据;鼓励利用公共数据从事科技研究、咨询服务、产品开发、数据加工等活动,公共数据利用主体因公共数据依法开发利用所获得的数据权益受法律保护。这些规则奠定了公共数据不得垄断的基本原则,除非法律法规另有规定。
对于公共数据,公共管理和服务机构享受何种权益的规范并不明确;对于开放是否收费,特别是对附条件开放的公共数据是否向特定的数据衍生利用者收费也未作规定。按照“谁提供,谁负责”的原则,公共管理和服务机构作为公共数据的提供部门应当及时维护和更新数据,保证公共数据的真实性、准确性、完整性、时效性和可用性,确保所共享的数据与本部门所掌握数据的一致性。这其中涉及到维持高质量数据的运行成本,如果相关费用没有纳入财政预算,可以向特定公共数据需求方收取一定的费用。即便有偿提供公共数据,也不能反证公共数据的财产所有权。况且,在公共管理和服务机构之间,以共享公共数据为原则,不共享为例外,开展无偿共享公共数据。
总之,数据资源的生命和价值在于其流动和利用,而非静态存储。除公共数据外,法律规范还应引导企业、行业协会等单位、个人开放自有数据资源。
三、平台垄断行为认定中的数据合规
(一)垄断协议中的数据
数据只是实现算法的生产资料,其在垄断协议中具有工具性,不应作为反垄断审查的主要对象。在《平台经济反垄断指南》中,无论是横向协议中的“利用数据、算法、平台规则实现协调一致行为”,还是纵向垄断协议中的“利用数据和算法对价格进行直接或间接限定”或“利用数据和算法等方式限定其他交易条件,排除、限制市场竞争”,还是分析轴辐协议是否属于《反垄断法》规制的垄断协议考虑经营者是否利用数据和算法等方式,达成、实施垄断协议,排除、限制相关市场竞争。“数据”和“算法”总是成对出现, 形影不离。因此,垄断协议中与其说考虑数据的因素,不如说考虑算法的影响。如果把数据视为一种没有意思表示的生产资料,它是相对静态的对象;而算法则是有“动态思想”,甚至可能产生意思联络的表意方式。例如,如果 A 网络平台将其产品售价固定在 B 平台同类产品售价的 100%,那么,A 平台调价时,B 平台自然跟随调价,可能产生协议涨价的客观效果。这也被形象地称为“算法共谋”,或被称为有意识的平行行为;虽然没有竞争者书面协议去干预价格,但却达到限制竞争和垄断高价的结果。因此,垄断协议的审查中应注意对算法共谋行为的审查。
利用反垄断法规制算法共谋问题,在形式可以对“协议”作扩大解释,“协议”不仅包括竞争者之间的“书面或口头协议”,也包括意图共谋的算法和机器代码;如同合同法项下承认电子信息合同的形式,也要在反垄断法中识别垄断协议的变形或电子化形式。对于算法规制本身,离不开加强算法透明度和可解释性的各种尝试,36 包括在保护企业商业秘密的前提下披露算法规则的运行逻辑,提供监管可读的算法版本等措施。
(二)市场支配地位认定中的数据
反垄断执法机构依法对认定或推定经营者具有市场支配地位的因素和情形进行分析时,考虑因素包括经营者的财力和技术条件。其中,技术条件除技术创新和应用能力、拥有的知识产权等因素之外,重点关注平台经营者掌握和处理相关数据的能力,以及这种数据处理能力能够以何种程度促进该经营者业务扩张或者巩固、维持市场地位等。
首先,此处的“市场”是指针对特定目标群体的线性市场,还是统一的“数据市场”?互联网平台提供的产品或服务既有社交媒体服务,也有广告、媒体、电子商务、网络游戏等服务。有人戏言,互联网平台的本质都是广告公司;如此,是否要把所有线下线上广告经营者纳入市场分析的范畴?以 Facebook 与 Whatsapp合并案为例,其中涉及移动通讯应用程序市场、社交网络服务市场和网络广告市场等细分市场;再以唐山人人公司诉百度案为例,如果相关市场界定为“搜索引擎服务市场”结果可能对百度不利,将相关市场界定为“广告市场”可能对人人公司不利。然而,将本质上为双边市场的搜索平台服务界定为单边市场, 不考虑双边市场的相互影响,可能导致市场力判断错误,从而导致最终结论存疑.
也有观点认为,互联网平台的相关市场就是数据市场。如果将每个互联网平台都认为是数据市场中的经营主体,那么互联网行业的任何一次投资、并购、协议或交易都应该进行竞争审查;这也会引发对平台经济规制和干预过多的隐忧。例如,《平台经济反垄断指南》(征求意见稿)公布之后,国内互联网科技巨头的股价应声下跌。因此,认定市场支配地位需要准确界定数据相关的市场,不能笼统地将其界定为“数据市场”。
数据处理能力成为平台最为重要的技术能力。从某种意义上说,平台之间的商业竞争是由技术实力来支撑的。互联网平台既是数据收集平台,也是数据处理平台;数据处理能力或成为平台经营者的核心竞争力。阿里和腾讯等有能力提供云计算商业服务的网络平台,其数据处理能力与普通网络平台不在一个水平能级上。阿里巴巴创始人马云曾直言不讳地说:阿里巴巴公司本质上是一家数据公司,做淘宝的目的不是为了卖货,而是获得所有零售的数据和制造业的数据;做阿里小微金服的目的,是建立信用体系;做物流不是为了送包裹,而是将这些数据整合在一起。数据收集和处理的技术能力越强大,越有机会使平台拥有巨大的品牌优势、网络效应,甚至具有跨行业的交叉引流和补贴的能力。因此,重点考察其数据处理能力这一核心技术条件,具体表象包括知识产权特别是数据处理相关专利的数量和质量,以及云计算的市场占有率等。
当考虑其他经营者进入相关市场的难易程度时,可以考虑平台规模效应、资金投入规模、技术壁垒、用户多栖性、用户转换成本、数据获取成本和用户习惯等。其中,规模效应的直接体现就是平台内经营者和用户的数量。因此,平台十分关注日活数据(单日的活跃用户数量)。显眼的日活数据一方面吸引到更多商家的入驻,另一方面,活跃度高的平台也是广告商的首选。
此外,除了比在位企业提供更好的质量和(或)更低的价格,新的市场进入者必须考虑到数据获取成本。市场进入者必须说服并协助在位企业的用户转移到它们的自身服务。欧盟 GDPR 赋予的个人数据可携(迁移)权可以制约平台的数据处理能力不均衡带来的负面影响,为中小网络平台的后发提供制度保障。数据可携权也成为支持欧盟境内个人数据的自由流动和促进控制者之间竞争的重要工具。
在上述用户或消费者自由转换平台服务供应商之外,还需要考虑到平台内经营者转向其他平台的可能性及转换成本等问题。当平台规定平台内经营者只能“二选一”时,一方面是涉嫌滥用市场支配地位, 另一方面也是借此锁定相关平台内经营者经营数据和消费者的个人信息及消费数据。从这个意义上来看, 设定平台内经营者的企业数据可携权也有某种必要性,另外还牵涉到数据标准和互操作性等技术支持问题。美国众议院发布的数字市场竞争调查报告也认为互操作性和数据可迁移性是恢复数字经济竞争的重要措施,包括要求支配性平台使自己的服务与不同网络相兼容,而且使内容和信息在不同平台很容易地被迁移。
(三)拒绝和限定交易中的数据因素
数据具有非竞争性,即使数据是市场进入的关键要素,也不能就此被视为必要设施;况且,给平台带来真正价值的是数据分析技术能力,而非仅仅是数据本身。《平台经济反垄断指南》认可“必需设施原则”(又称“必要基础设施理论”)可适用于相关数据平台的可行性,具体提出:认定相关平台是否构成必需设施,一般需要综合考虑该平台占有数据情况、其它平台的可替代性、是否存在潜在可用平台、发展竞争性平台的可行性、交易相对人对该平台的依赖程度、开放平台对该平台经营者可能造成的影响等因素。
传统上,必需设施原则的适用都与自然垄断设施有关,但大数据毕竟不同于高速公路、输油管道或铁塔公司。但《平台经济反垄断指南》认为占有大数据的平台可能适用反垄断法中的“必需设施原则”,确立此种原则在数据市场中的适用对规制经营者滥用市场支配地位行为具有重要意义。
数据的不可或缺性是指特定数据对于特定交易或业务场景的不可或缺,而不是一般意义上的数据是平台赖以生存的基础。相关平台是否构成必需设施,关键不在于其是否具有数据的商业价值,而在于其是否是唯一的、不可复制且无可替代的。“唯一性”往往意味着设施的“不可替代性”;在几乎所有的必要设施认定标准中,设施的“不可替代性”成为必要因素,即,市场上不存在可替代性产品是必要设施原则适用的先决条件。从领英和 HiQ 案来看,基于领英独特的数据控制地位,可以优先获得职业数据的增值价值,并可能使无法获得替代数据或无力承受数据成本的包括 HiQ 在内的现有或潜在竞争者退出或放弃该市场。
数据获取的渠道可以分类为自愿提供数据、操作(交易)生成数据以及分析推断获得的数据。不同的数据类型和获取方式,可能影响竞争对手独立收集或获取相同信息的能力。以个人信息数据为例,任何平台都可以从消费者手中重新获取个人信息,并通过留住用户持续产生活跃的交易数据;只要消费者使用平台的服务,个人信息为基础的各类数据被平台广泛收集。并且,平台与关联公司之间存在密切的数据分享行为,这些在平台的隐私政策之中都有明文提示。数据的共享和开放在技术上并不非难事,但出于“独占” 数据的考虑,平台没有开放数据的动力机制。数据开放对占有数据的经营者可能削弱其自身的竞争力,例如平台往往只向关联企业开放数据,说明数据开放在技术层面并没有障碍,但数据开放后,可能对自身业务产生重要影响,可能会导致客户的分流、点击率和停留时间等流量丧失。
数据大量积累的同时,必然出现对“垄断”数据的担忧。一些企业或国家为了维护自己的优势利益而拒绝数据的流动,这不仅浪费了数据资源,而且会阻碍创新的实现。对相同类型的数据或者补充性数据资源进行汇集和挖掘,可以让企业开发新的或更好的产品或服务,或者在更广泛、更有意义的基础上训练智能算法。在国际法领域的多边和双边国际贸易议题中,美国为首数据开放主义者认为,一国不得要求将数据存储在本地,而应当允许其自由跨境流动。这也引发其与注重数据安全和数据主权的贸易伙伴之间争论不断。
最后,平台经济领域经营者在拒绝和限定交易时可能援引为保护知识产权或者数据安全所必须的正当理由。诚然,作为知识产权载体内容或表现形式的数据应当得到法律保护,平台开展数据活动也的确需要采取相应的技术措施和其他必要措施,保障数据安全;但这种正当理由需要确实“正当”和“必须”,而不能是逃避执法审查的挡箭牌。
(四)差别待遇中的数据因素
具有市场支配地位的平台经营者可能滥用市场支配地位,无正当理由对交易条件相同的交易相对人实施差别待遇,排除、限制市场竞争。例如,网络平台基于大数据和算法,根据交易相对人(客户)的新老程度、支付能力、消费偏好、使用习惯等,实行差异性交易价格或者其他交易条件。这在实践中被称为“大数据杀熟”或“个性化杀熟”。理论上这种区别定价也可能发生在新客户身上,即“大数据杀生”,但由于网络平台或平台内经营者往往通过给首次交易或首单交易以优惠价格来吸引消费者停留或沉浸其中,“大数据杀生”并不常见。
如同前文中对垄断协议中数据因素的分析,此处“大数据和算法”二者的重心依然是算法。通过收集丰富的个性化数据,算法可以做到展示和交易页面的“千人千面”,甚至为每笔交易量身定制一份个性化合同。交易场景中“从身份到契约”的演变逻辑又回到古代的“从契约回到身份”,只不过此处的“身份” 不再是阶层或特权,而是支付能力和消费偏好等个性化标签。
现有法律规范中已经针对此问题提出解决去个性化的解决方案,然而结果并不理想。《电子商务法》第 18 条要求电子商务经营者根据消费者的兴趣爱好、消费习惯等特征向其提供商品或者服务的搜索结果的,应当同时向该消费者提供不针对其个人特征的选项;该法第 77 条配套行政处罚规则,即由市场监督管理部门责令限期改正,没收违法所得,可以并处 5 万元以上,最高至 50 万元的罚款。实践中,网络购物平台的展示页面和搜索结果依然是“千人千面”,也没有网络经营者为消费者提供一键恢复无个人特征的展示页面或搜索结果的功能。然而,经检索市场监管总局行政处罚决定文书,没有发现因违反该条而被处罚的案例。
(五)经营者集中的数据因素
《反垄断法》禁止经营者实施具有或者可能具有排除、限制竞争效果的集中。实践中,互联网平台的经营者集中十分频繁,包括滴滴与快的合并,美团与大众点评并购等。经营者集中的竞争分析应当重点关注平台(或生态系统)的市场支配地位,因为平台集中可以加强将新服务视为平台(生态系统)所提供服务的补充服务的用户的忠诚度;或帮助留住那些将新服务视为既有服务的部分替代品的用户。
就互联网平台而言,数据处理能力几乎等同于市场控制力。挖掘和分析数据价值要求平台企业具备更大的存储空间和数据中心,更强的中央处理器和不断更新的优质算法,这些基础投入对平台的资本基础和技术能力带来很大挑战。如果平台企业强强联手或者取长补短,那么显然会在客观上阻碍潜在竞争者进入市场,也会对现有竞争者产生影响。
为了规避数据相关经营者集中带来的竞争审查,平台经营者为了绕开法律规制采用迂回路线,不直接进行数据交易或经营者集中,而是采取投资等其他方式进行实质合并或实际控制以规避对数据驱动型的反垄断审查。平台企业参与对外投资,配套的往往还有云架构、定制算法、数据中台等重要的数字化工具,甚至派出专业团队与被投资方共同研发针对性的解决方案。因此,平台创建或打造以平台为中心的数字生态体系的行为,都应考虑其对市场、创新和竞争的综合影响。
总之,对数据集中的并购审查,不仅要看到数据集中带来的市场力量的加强,也要看到数据集中对于降低信息不对称和提高动态效率的作用,结合个案分析权衡是否准予合并。
四、结语
如前文所述,拥有数据的多寡并不能直接构成垄断与否。数据的经济价值与数据的容量并不成正比, 等量的不同性质的数据市场价值也有差异,例如 1TB 的金融大数据和 1TB 医疗大数据的定价不尽相同。脸书(facebook)从来没因为拥有 20 亿用户的数据本身而遭到美国司法部指控;脸书能收集 20 亿用户的数据,微信也有机会收集 20 亿用户的数据,这是用户根据自我体验,可以用脚投票的事件,竞争越充分, 数据越不容易集中和垄断。
“数据垄断”这一提法本身可能是以“数据保护受害者”或“数据劣势者”心态提出的担忧,特别是面对以美国为首强大的高科技公司和社交网络平台所产生的“数据虹吸”现象,即欧盟公民的数据都被GAFA(谷歌、亚马逊、脸书和苹果)收集,而欧盟本土企业却很难收集到欧盟境外的数据(个人数据)。因此,可以说 GDPR 就是欧盟发起的一种数据反垄断措施,还包括欧盟拟议的对某些数字服务收入征收数字服务税的措施。然而,这些反垄断措施是否抑制 GAFA 在欧盟的业务发展?关于 GDPR 的运行交易评估表明,从产业发展的角度,谦抑审慎应当是数据相关反垄断执法的基本原则。
我国《平台经济反垄断指南》并不直接针对数据密集型平台企业,也没有先入为主地将数据密集型企业作为执法优先审查的对象,而是关注具体的反竞争行为,例如经营者达成垄断协议,经营者滥用市场支配地位,具有或者可能具有排除、限制竞争效果的经营者集中。数字时代的反垄断执法需要关注到数据在数字竞争中的特殊意义,结合行为类型和特点,分析平台的数据行为对市场和消费者的影响作出竞争与垄断的综合认定。