7月5日,杭州区块链国际周分论坛【“隐私计算:让数据安全有序流动起来”暨2020隐私计算产业30强榜单颁奖典礼】顺利开幕。此次论坛由算力智库联合巴比特、海南省大数据管理局、上海人工智能发展联盟、长三角大数据产业合作联席会议、新财富等共同举办,论坛汇聚了国内外近几年来在隐私数据与安全计算领域专注耕耘的大厂、金融机构与科技企业重磅嘉宾与专家首次云集,共享数据应用思辩饕餮盛宴,同时,还颁发了2020隐私计算产业30强榜单。
在分论坛中,矩阵元COO谢红军做了题为《隐私计算是为数据定价的基础和方法论》的主题演讲,分享矩阵元在隐私计算研究的方向,包括跨域的数字身份、数据安全共享、数字地址、数据安全匹配、多方联合建模以及安全模型的应用这六方面内容。
以下为巴比特整理的演讲全文:
我是来自矩阵元的谢红军,隐私计算这个话题是我们2018年12月1日在深圳发起的,其实隐私计算这个概念不是一个新概念,它是一个学术的语言。我们当时发起面向产业隐私计算,当时是2018年上半年,数据隐私泄露这件事情愈演愈烈,2018年的3月份,Facebook的信息泄露,剑桥分析丑闻,那个是互联网的标志事件,数据隐私引起全世界所有人的觉醒。
在这之前互联网还有一个标准事件,就是网络犯罪,2017年那个勒索病毒,这个事情是标志着互联网自己的犯罪变成全球化了,任何人不能独善其身,其实隐私泄露这个事情其实所有人都是互联网企业数据的提供方和数字的员工,这里就要有问题了,互联网的发展、科技的发展才是代表人类文明发展的很重要的标志,互联网带来我们很多的便利性的服务,各种APP,还有各种的社交的广泛性,它带来了刚才所谓的两个问题,就是互联网的犯罪和隐私泄露这个问题。
2019年的1月19日,万维网之父,他是2016年图灵奖得主,他是麻省的教授,2019年全球新兴技术科技论坛他做了一个演讲,他说到互联网已经失去了它的初心,同时他认为它的长尾效应已经消失,他认为这件事情是失败的,所以推出一个基于分布式的平台想用分布式的办法解决互联网面临的问题,要颠覆他一手创办的万维网。
我今天分享矩阵元在隐私计算研究的方向,实际上给大家汇报一下一年半以来矩阵元在隐私计算做的一些工作。
振金社对于全球隐私计算进行重新定义和广泛宣言,2018年年底提出,引起了媒体当时的广泛关注,2019年、2020年上半年,真正为全行业做了一个很大的话题的传播,现有的数据痛点:第一,受限于将来越来越多的法律法规,将不能直接用于明文交易。第二,数据变成企业的核心资产,企业不愿意进行明文交易。第三,跨企业间系统、身份等无法打通。第四,如果需要明文交易,这个事情不能杜绝的,明文一定是需要的,如何解决明文交易以后数据价值的保全问题,交换一次后续价值如何保护数据所有方的利益。
全新的数据交易模式,我归类为四种:
-
第一,完全合规条件下进行数据协同,当然这里包括明文的协同,也包括隐私计算的智能就是所谓的密文协同。
-
第二,数据可以作为资产进行变现,同时不再泄露明文,确保企业对数据所有权的保障。
-
第三,通过区块链和公安部一所或者三所正在做的EID、DID这样的技术进行身份打通。
-
第四,确保数据利用的越多、交换的越多、协同计算的越多、价值越大,这是基本上的经济学的逻辑,现在是没有这样的逻辑,未来会实现。
我汇报六个方面:
-
第一,跨域的数字身份的问题。
-
第二,数据安全共享。
-
第三,钱包(数字地址)。
-
第四,数据安全匹配,这里很有意思,最近很多的金融机构和我们的合作在搞一些,我一会儿会重点讲。
-
第五,多方联合建模,牵扯到人工智能,就是数据和算法如何在各自隐私需求的情况下金协同。
-
第六,安全模型的应用。
一、跨域的数字身份的问题
跨域分布式身份,DID是以用户为中心,实现跨域认证和隐私保护的分布数字身份体系,矩阵元Pldentity的优势在于遵循W3C-DID国际认证标准规范,具备友谊的可扩展性和互操作性,具有双重数字身份,还有就是数据的强隐私保护,使用数据身份的时候,对数据身份进行可选择性的提供。
DID有三种角色:第一,颁证方,所谓的国家机构,拥有公安数据,可以提供基于可信数据的身份。第二,验证方,需要验证身份的这个人,比如说酒店,比如说因为疫情缘故经常登记你的身份,实际上是不合理的,你看我的轨迹、我的码就可以了,这个码及轨迹背后也有隐私泄露问题。第三,持证用户,根据我的需要,我选择性的提供,进门你如果想知道我的轨迹就提供轨迹,不需要在一个纸质的本上写我的名字、身份证和号码,这三个要素很多信息被串联,我的身份证、手机号码、名字,这个事情泄露的场合对我来说是极不安全的。
二、数据安全共享
数据的安全共享,我介绍三个方案:第一,和传统云计算相关的把数据存在云上,我们叫做加密云存储和数据的授权,我们做的办法就是,在数据拥有方把数据分享给一个或者多个用户,在线下进行存储,然后进行一些授权的解决办法,这个和云计算很像,但是云计算存在的问题是云计算的平台对你的数据天然可以操作的,虽然生称不操作这个事情,但是这个事情没有人做证据的,如果用了这件事情以后,也可以解决云常常自证清白的问题。第二,区块链分布式存储和智能合约的授权。第三,区块链钱包的管理,这里有一个概念,就是所谓的区块链钱包有一个秘钥,我们采取的办法是把秘钥分片,秘钥存在不同的人的地方,使用这个秘钥的时候拥有分片秘钥的人进行协同计算,把这个秘钥恢复出来,但是没有任何一个拥有分片秘钥的人知道这个秘钥的全貌,所谓的分布式秘钥的概念,这个我们也有一个产品。
三、钱包(数字地址)
钱包如何实现隐私交易,我这里提的隐私交易不是要避开监管,有很多人的需求是需要我俩之间的交易不需要让你知道,但是不规避监管,监管一定可以穿透式管理,这个就是发起这笔交易的时候如何进行隐私交易。
四、数据安全匹配
数据安全匹配,这个有几个方面,金融领域用的很多很多,我们最近在和几家金融机构做数据银行的概念,未来银行不是一个金融机构,它是一个数据的机构,所有的金融产品建立的基础都是背后的用户的数据,包括它和其他机构之间打通的数据。保险和银行之间如何数据打通,大家知道保险对于银行数据、对于医疗数据的需求可以说是很难,最难打通的是医疗数据,如何把数据打通,实际上有几个概念,就是你要让它的数据不要离开本地,这件事情是第一步,第二步你这个平台产生的价值要和他分享,第三步是给院长发论文提供一定的算法。保险公司如果想知道它的某一些群体的用户在银行的状况,它和银行之间的数据计算就有意义了,如果银行的数据不离开银行的服务器,*****不离开保险的服务器,保险红海将会极大激发,一个合理或者一个标准的可以定向发布的保险产品发布出来,将会有极大 市场,这个对保险是有很大的吸引力。
还有数据的标签,不要获得数据的全部,但是要知道数据是怎样的属性,比如说我要知道我这个用户在几家银行中有几张信用卡,信用卡有多少次逾期,背后就是征信,征信就是通过它们之间联合计算的征信,是分布式的征信,不是中心化的,现在用PSI的技术就可以来实现,来为保险公司和银行之间来提供这个服务的技术。
还要知道他的存款记录,这个事情对保险意义更大了,比如说一个人他买了很多的保险,他要知道这个人在银行的资产状况,以及在其他保险公司的保险产品的服务情况,这件事情过去要给银行的保险公司要的时候,这是实现不了的,都是大家核心的东西,如果用算的办法告诉他这个人资产大于1000万,而且信用良好,保险公司完全可以放心的卖一个巨额保险给他,他就是潜在的保险客户,而不是骗保的客户,这个事情意义就在这里,安全数据匹配技术为金融机构、银行、保险等等这些机构进行所谓的数据孤岛式的协同计算提供了技术的方案。
五、多方联合建模
还有多方联合建模,解决的就是人工智能的痛点,所谓的算法无数据可训练,不同的算法之间的共享面临的所谓的所有权的问题,如果数据所有方和模型所有方,也就是说算法所有方对于隐私不同的要求下我们搭建一个系统来做,如果对它的隐私要求不高的情况下当然可以让他明文进行交易和计算,如果数据拥有方对隐私要求很高,就把数据这一方隐私掉,如果模型这一方,对模型未来计算价值很大的时候就把算法隐私掉,这个事情就解决了人工智能、大数据等等痛点。
六、安全模型的应用
安全模型的应用,大家提到很多的技术,我们矩阵元开原了一个Rosetta,让爱的开发者和使用AI技术的使用者进行简单化的计算,背后的算法使用方不需要知道,只需要提供的服务授信,就可以自动匹配不同的算法。后面没有几个附录,关于安全模型的,时间原因不讲了。
为了数据的流动是矩阵元的口号,数据作为生产要素流动起来,发挥真正的价值要解决三个问题:
-
第一,数据的所有权和隐私保护的问题。
-
第二,数据的定价的科学性问题,这个事情像过去大数据中心的办法来定价也是一个问题。
-
第三,最重要的是,数据和算法服务的清结算问题,这个事情如果不用平台的办法来解决将是最后一公里问题没有解决,为了数据的流动,为了让数据新生产要素流动起来要解决这这个问题,隐私保护是一个,定价是一个,定价一定用精细的方法定价,一个和用区块链原生的技术,就是清结算的工具进行数据服务的清结算。
谢谢大家!