作者:吴卓铖

从 2014 年伴随着区块链隐私概念的兴起而出现众多匿名币以来,加密货币的热门赛道可谓城头变幻大王旗。时至今日,真正能将隐私保护技术落地的项目竟无一例,可事实上,隐私保护绝不应该与众多红极一时的炒作赛道混为一谈。区块链想要真正发展为一个虚拟的平行世界,避不开的是在这新世界中创建一个合理的经济制度。

在传统经济体系中,生产要素只有土地与劳动力;工业时代增加了资本与企业家才能(马歇尔理论);而数字时代,数据已成为重要的生产要素。生产要素的市场化分配能提高生产效率,可数据“所见即所得”的特殊性却导致它不像其他要素那样存在价格。我们每个人都是数据的所有者和供应方,就像每个人都提供劳动力一样,可我们却没有因为提供数据而获得相应报酬。究其根本在于数据尚未实现私有化,这便是隐私保护技术的意义所在。

隐私保护的几种技术

中国信息通信研究院依托中国通信标准化协会大数据技术标准推进委员会于 2020 年发布的《隐私保护计算技术研究报告(2020)》将隐私保护技术分为五种:联邦学习、差分隐私、安全多方计算、同态加密、可信执行环境。其中,联邦学习和差分隐私主要在机器学习领域应用较广,且对原始数据的加密复杂度一般,不在讨论范围。此外,区块链中还有一种基于零知识证明的隐私保护技术。

安全多方计算(MPC)最早由图灵奖获得者,中国科学院院士姚期智于 1982 年提出。其技术逻辑是:在一个分布式网络中,有 N 个互不信任的节点,每个节点持有数据 x,并协同执行函数 f(x),最终得到各自的结果 y,若各节点的 y 值相等,则可输出为计算的结果。MPC 的最大优点是做到了数据的百分百隐私保护,并且计算的结果也可以做到相对精确;挑战点则是对带宽的要求极高,当协同参与者较多时通讯水平将是一大考验。目前的安全计算单个运算可以达到毫秒级,但在大数据场景下,一个数据应用或模型训练涉及到上万的数据样本,运算效率和通讯负担是阻碍 MPC 发展的瓶颈。

同态加密(HE)是一种非对称加密算法,所有参与者都可对数据进行加密和计算,但只有私钥持有者可以对数据进行解密。HE 的特殊之处在于,它允许在加密后的数据上直接进行计算,理论上计算结果与解密后的计算结果保持一致。可以想象,HE 算法下的计算结果难以做到极高的精准度,如何权衡加密复杂度与计算精准度将是一大考验。全同态加密目前仍基于理论阶段,在可信度和灵活性,效率等各方面都相对较落后,实际运用时效率太低,构造方式和实现技术复杂,尚不能大规模商业应用。

可信执行环境(TEE)是目前大规模商用最广泛的技术,例如手机上的指纹解锁,人脸识别等。TEE 的数据加密必须依赖硬件设备,计算过程在基于硬件防护能力的隔离执行环境中进行,因此在安全性上需要依赖一个可信任的硬件厂商。TEE 的应用项目主要有 Phala Network、Oasis Labs、Enigma 等,相比于其他隐私计算方案最接近实用场景。

零知识证明(ZKP)是一种特殊的交互式证明,其中证明者知道问题的答案,他可以在不向验证者提供任何有用的信息的情况下,使验证者相信他的答案是正确的。零知识证明可实现灵活的数据计算交互和交叉验证,但实现难度仍然较高,因为需要通过反复举例验证才能证明答案为真,这对算力要求非常高。目前能够生成证明的效率在 7 秒左右,需要大量的算力来提高计算速率。以太坊二层链 ZK rollup 就是应用零知识证明,因此 ZK rollup 的意义不仅在于扩容,更能协助以太坊实现链下隐私计算。

隐私计算目前面临最大的挑战在于如何提高隐私保护效率,实现大规模的商用落地。 以上几种技术,无论是基于计算的 HE 或 MPC,还是基于验证的 ZKP,都存在这个问题。唯一能实现商业应用的 TEE 则依赖于硬件设施,而专用计算硬件的研发与生产需要庞大的前期成本,因此这也是为何隐私计算概念从 2014 便已出现,可至今也没有一个真正落地的项目。这更像是产业区块链,与我们传统意义上区块链有所不同,它需要打通虚拟世界与现实世界的联系。

PlatON 隐私保护设计是将上述部分技术相结合,力求从三个角度实现网络全方面隐私:隐私计算、隐私验证、专用隐私电路。首先通过 MPC 和 HE 实现隐私计算;然后通过 ZKP 和可验证计算(VC)对计算结果进行验证;最后结合合约计算化,将经过加密的智能合约编译成电路,以电路的形式拆分成多个子任务,通过激励机制吸引网络中的闲置算力对子任务进行计算,解决上述技术普遍存在的效率问题。这种思路事实上也借鉴了以太坊的 ZK rollup,将复杂运算移至链下,只将计算结果传回主链。由于需要将智能合约编译成电路,因此 PlatON 团队必须与业界主流硬件厂商合作,用硬件的方式进一步提高计算性能。

PlatON 的特殊的 PoS 共识算法

根据官方白皮书,PlatON 将在合适的时候推出基于 FPGA/ASIC 的专用计算硬件,这不是简单的 PoW 挖矿,PoW 只是共识协议的一种,只要社区达成一致,PoW 完全可以改成另一种共识,例如 PoS,以太坊便在朝这个方向实践。但 PlatON 是将共识与算力分离,算力只用于执行隐私保护计算。PlatON 公链起到计算任务分发、计算任务与算力匹配以及交易记录等功能,核心计算工作都发生在公链外。当然,你可以将这理解为一种变相的 PoW,但隐私计算不是一种无意义的谜题破解游戏,即使离开区块链,这些计算硬件一样可以投入到中心化的世界提供隐私保护作用。

由此笔者推测,PlatON 的生态维护方式或将分为两部分:一部分是采用 PoS 协议获取固定出块奖励,一部分是提供算力获得数据需求方的劳务费。

PoS 部分,首先概述一下业界主流的四种模式:Chain-Based、DPoS、VRF 与 BFT。Chain-Based 就是最早的 PoS,根据持有 token 的数量选择验证人进行区块生产,以太坊目前采用的就是这种模式。DPoS 是每个 token 持有人把权利委托给部分代表,由代表参与区块的生产和验证, EOS 目前采用这种模式。VRF 是通过可验证随机函数随机选取验证节点,目前比较有代表性的项目包括 Dfinity、Algorand 等。BFT 是选出验证节点后通过拜占庭容错协议进行多轮投票以确认最终区块,目前 NEO 采用这类共识算法。

根据官方蓝皮书,PlatON 采用一种特殊的 PoS 共识算法——Giskard,由 PPoS (PlatON PoS)与 BFT 组成。PPoS 本质上是 Chain-Based 与 VRF 的结合,首先将节点权益映射在二项分布累计分布函数上,然后运用 VRF 随机选取验证节点。这种共识的好处是选取的节点具有随机性,与节点权益大小无线性关系。节点确认后,各节点通过 BFT 协议对产生的区块进行验证,最终达成区块共识,这样可以降低某个区块被恶意节点控制的概率。Giskard 共识机制理论上可以内生地抑制矿池的规模扩张,以保证 PlatON 公链的去中心性和安全性。

第二部分是提供隐私计算,以获取数据需求方的劳务费。笔者认为这是 PlatON 共识协议的精髓,如果该共识效果能达到预期,那么数据这一要素的市场化定价将得以实现。数据交易过程中存在两个问题:一是所有权不明晰,容易在未经授权的情况下被使用;二是数据结构多样,难以按统一标准量化。

蓝皮书中显示的方法是使用 HE 和 MPC 等密码学技术进行数据确权,确定数据的所有者。数据交易过程中坚持数据主权原则,使得在不影响数据所有权的前提下交易数据使用权成为可能。数据定价有两种方法:第一种是绝对定价,即数据使用者愿意为获得数据而付出的代价;第二种是相对定价,即给定一个数据集和一个共同任务,评估数据集的成员对完成该任务的贡献。相对定价运用了 Shapley 值作为重要评估工具,这是著名经济学家 Lloyd Shapley (2012 年诺贝尔经济学奖得主)在 1953 年研究合作博弈时引入的一个重要概念。

行业发展现状

隐私保护赛道主要有两条发展路径,其一是匿名币,其二是隐私公链。

匿名币有代表性包括 XMR、DASH、ZEC、XZC 等,XMR 作为该领域的头部项目在 2014 年就出现了。这项技术只需对发送者、接收者、交易金额和交易 IP 等信息的加密即可,这样便只有参与交易的双方(或授权的第三方)可以通过私钥查看交易信息。由于货币流通不存在太多复杂信息,因此加密货币要实现匿名交易并非难事,这项技术目前已经十分成熟。事实上 BTC 也在通过社区投票来升级隐私算法,诸如 CoinJoin 等技术可以将多笔交易合并来掩盖 UTXO 的上游。

隐私公链技术则较为复杂,它本质是对智能合约进行加密,需要对输入和输出数据以及网络状态进行加密,使其对用户本人以外的所有方(包括执行智能合约的节点)隐蔽。目前发展前景最广阔的当属以太坊的二层网络 ZK rollup 和波卡的平行网络 Phala,但这些只能作为子链或平行链存在,主要是为主链提供数据计算,计算结果须传回主链。而若想开发一条独立的隐私公链,难度犹在上述技术之上,目前的头部项目当属 PlatON 与 Oasis,一旦完成其潜力将无比巨大。原因是:作为独立公链,它们既可以直接在主链上开发隐私智能合约,又可以作为侧链或平行链为其他公链提供隐私计算。

Oasis 团队成员包括来自伯克利大学的 Dawn Song 教授以及多位世界领先的安全专家,目前已获得了包括 Binance Labs、a16z 等投资机构在内的 4500 万美元投资。并且,Oasis 已实现与以太坊网络的交互,逐渐有开发者尝试在 Oasis 网络上建立的 NFT 项目。

PlatON 目前已获得高山资本、Hash Global Capital 等机构 5000 万美金的投资,与 Oasis 相同之处在于,二者都实现高并发的隐私计算;创新之处在于,PlatON 网络除了共识网(主网)和隐私计算网,还有一层独立的 AI 网络,旨在实现大数据模型训练。

引用

[1] 中国通信院,《隐私保护计算技术研究报告(2020)》

[2] 《PlatON. 经济蓝皮书(V0.1.1)》

[3] 《PlatON. 白皮书(V6.8)》

根据银保监会等五部门发布的《关于防范以“虚拟货币”“区块链”名义进行非法集资的风险提示》,请读者遵守所在地区法律法规,本文内容报道不对任何经营与投资活动推广进行背书,请投资者提高风险防范意识。吴说区块链刊载内容未经许可,禁止进行转载、复制等,违者将追究法律责任。