电影《天下无贼》里有这样一句台词,“21世纪什么最贵?人才!”
近十年过去,如果把这个句式套在数字化这个大背景下,那最贵的一定是“数据”。
数据被形容为“21世纪的石油和钻石矿”。根据IDC数据,2020年全球数据量达到59ZB,以数据流通为基底的数字经济是产业发展的主引擎。
关于数据流通,产业界有一个“三角难题”,即任何单一隐私计算技术无法同时解决“安全、隐私”、“质量、易用性”、“流通性”这三个问题。换句话讲,数据在流转过程中不止是“可用不可见”,还要解决多方协作之间的数据权属和真实性等问题。
老话讲,“跳进黄河也洗不清了”。而在数据流通这个场景,不管数据怎么“洗”,都需要看到清晰的授权、确权、鉴权关系,这是确保数据能发挥价值的关键。
近日,IDC发布报告《隐私计算全景研究2022》指出,放眼于数据流通场景,展望5-10年之后的数据要素市场,区块链等相辅相成的技术能力将显得不可或缺。
IDC:“随着隐私计算在数据要素交易市场中扮演更重要的角色,接入跨领域、新场景、更多数量的数据参与方,就注定需要区块链作为信任底座协调参与方间的信任。数据是否造假、数据是否能够自动化进行授权使用都将运用到区块链。此外,从使用闭环的外部监管的角度看,区块链作用也是不可或缺的。”
为解决数据需要开放却不能开放的矛盾,我的同事研发了摩斯隐私计算平台,在金融、科研、政务等10多个行业的上百家机构应用;为满足更大范围的数据流通和协作需求,他们也正在“隐私计算+区块链”融合技术的方向上探索、努力。
迈向隐私计算原生
去年云栖大会,蚂蚁链数据隐私协作平台(FAIR)正式发布,这是一套面向数据价值流转的原生计算流转模型。在这个架构上,隐私计算作为一种原生能力与区块链深度融合在一起。
之所以强调“原生”,就是面向数据全生命周期来思考,包括数据确权、数据流转以及数据价值再分配等问题。正如建筑师的脑子里不止装着房屋的外立面,各种斗拱穿梁早已是心中有数。
我们拆开来看:
隐私计算主要解决数据共享计算环节中的数据隐私保护问题,在数据加密或者不透明状态下完成计算和分析;
区块链则侧重构建可信协作网络,通过智能合约实现链上数据真实性验证和审计,呈现清晰、真实的数据权属关系。
区块链与隐私计算有机结合,能使得原始数据在不出域的情况下,实现多节点之间的可信协同计算和数据隐私保护,发挥出“1+1>2”的价值。
“隐私计算+区块链”具有天然的互补性,但很多产品实质上是松耦合的。
目前,行业内的通用做法是,通过双系统架构将两者结合,对于客户来说,需要采购、配置两套系统才能实现协作目标,且在协作过程中,两套系统的适配能力和安全也存在挑战。
我的同事福莺这样说,“未来的行业协作中,数据隐私保护将成为底层需求,我们认为隐私计算应该直接原生在区块链网络平台上。”
蚂蚁链数据隐私协作平台不是区块链和隐私计算这两项技术的简单相加,而是实现了深度融合,协作流程由智能合约驱动,数据流转由隐私计算引擎解决,并通过区块链确权、共识。
这一平台在区块链网络上做了进一步扩展,每一个区块链节点也成为一个隐私计算节点。
福莺跟我说,像当年智能手机集成电话、相机、音乐播放器等功能一样,FAIR平台打破了技术边界,真正意义上实现了区块链和隐私计算的深度融合。
你中有我,我中有你
区块链和隐私计算本就应该是“你中有我、我中有你”的样子。在这里可以跟大家分享一个故事:
我的同事里有很多人之前都是行业线的专家。其中有一位,她叫英之。
在加入蚂蚁链之前,她帮助一个团队做了三年的农业数字化项目,可以说把能数字化的都数字化了,包括材料、生产过程、物流等,等到她去银行申请融资时,银行只问了她一个问题,“我怎么trust(相信)?”
凭她三年在数字化上的努力,也没有找到一个机构愿意帮她来背书。她又跟银行说,“如果整个流程上链,你是不是可以相信?”银行说,可以试一试。
用她自己的话来说,“在数字经济背景下,一定会走到一个阶段,而那会是迈不过去的坎儿,而这必须用技术来解决。”
所以我们回到主题,隐私计算技术算出了一个结果,当它涉及到二次流转时,中间环节缺失的还是“信任”。
目前,蚂蚁链数据隐私协作平台(FAIR)已经在政务、金融等多个场景中应用。以政务场景下的“查低保”为例,它需要涉及到多方的信息确认:
第一步,“张三算不算低保户?”请求指令发出;
第二步:这个指令在民政局、财政局、大数据局等机构中加密计算并流转,看看张三名下是否有房产、车辆等;
第三步,形成一个“张三是低保”的标签,再通过区块链记录。
其实,在经历第三步之后,“张三是低保”这个标签的所有权已经是民政、财政、大数据局等机构共同计算所得。
在数据流转的过程中,经过了加工确权、再加工、再确权,链路清晰,权属清晰。在这里面,区块链首先提供了多方协作网络,其次是呈现了真实的确权、授权关系。
独立仓库、灵活组搭
针对复杂的数据协作场景,我的同事们把数据隐私协作平台归纳为——FAIR:
可发现(Findable)
可接入(Accessible)可审计(Auditable)
可协作(Interoperable)
可复用(Re-usable)、可回收(Re-cyclable)
这些特征直接定义出了平台的特征:
支持数据治理规则和分类分级管理,帮助用户在业务协作中能高效找到数据,每个数据条目都带有类别/级别/共享规则信息;
支持数据权限控制和多数据源接入,多方协作时,可根据在合约中的数据权限进行操作,支持异构数据源接入;
通过划分协作子网、区块链和隐私计算能力融合,灵活适用于不同的协作任务需求;
支持数据资产全生命周期流转,数据可验证可追溯。
总结一下,FAIR平台为不同隐私等级的数据提供了独立存储仓库,数据使用方也只能“拿一把钥匙开一把锁”,对重要数据重点保护;另外,平台上提供可插拔的隐私计算能力,用户可以直接使用拖拉拽的方式,完成数据的碰撞、计算,并开启全新流转。
*平台融合了多方安全计算(MPC)、可信执行环境(TEE)、联邦学习(FL)三类主流的隐私计算技术,涉及不经意传输(OT)、秘密分享(SS)、混淆电路(GC)、零知识证明(ZKP)、差分隐私(DP)、等多种密码学、隐私保护密码学原理应用。用户可以非常灵活地做自己的个性化解决方案。
互联网时代,大家通过网购形成了“商品物流”,但是在数字时代,数据资产流转和商品物流是完全不一样的,数据价值从我到你,从一端到另一端,整个过程中要完全保障各方的权益,这里面挑战很大。
我的同事项城跟我说:“基础技术研究相当于搭建基础设施,而基础设施一定要有前瞻性,顺应趋势,只要方向是对的,那基础技术的应用价值是毋庸置疑的。”
原文出处:,不代表云顶量化立场,如有侵权,请联系删除
云顶量化是币圈专业量化策略团队,团队成员均有3年以上金融量化实战经验,主要针对比特币量化(BTC),以太坊量化(ETH),狗狗币(DOGE),SHIB等各种虚拟数字货币推出资金费率套利策略和合约趋势型量化机器人策略。经过长时间实盘测试,策略的稳定型,实用型,可行性都是顶尖水平。