公信宝数据交易所产品白皮书

发布于 2023-06-21 13:07:20 字数 8873 浏览 121 评论 0

一.摘要

公信宝数据交易所是⼀个通⽤的去中心化数据交易平台,是基于公信链 GXChain 开发的首个大型商业应用, 公信宝数据交易所具有不缓存沉淀数据、保护个人隐私、保护数据版权、有效遏制造假以及支持双向匿名交易等特点。面向的典型客户为互联网金融领域的网络贷款、汽车金融、消费金融、银行等有数据交换需求的企业,同时也积极拓展在政府、保险、医疗、物流等垂直领域的数据交换,以去中心化思维解决了各个行业的数据安全交换和流通等环节中一直没有解决的诸多核心信任问题,并可以为全社会所用,广泛使用于公民的学习、工作、生活等各种应用场景中,让数据释放应有价值,提升社会协作效率。

二.名词解释

公信币 是商户在公信宝数据交易所的买卖数据的结算记账数字货币,和人民币 1:1 锚定,价值不变,确保购买数据成本稳定,公信宝运营公司作为公信币和人民币的承兑商。

节点 就是公信宝数据交易所的客户端,每一个客户端都是一个独立节点,通过 P2P 网络链接在一起。

数字资产 指的是公信宝数据交易所中所交易的数据,包括但不限于贷款记录、逾期记录、放款记录、高风险欺诈记录、生活信用、法院执行记录、工商信用、五险一金、消费记录、运营商记录等数据。

交易双方 指的是数据交易所中买卖数据的双方。

数据源 指的是在数据交易所上架的数据资产的来源。

商户 指的是数据交易所中有权限参与买卖交易的成员,主要由银行、网络贷款、消费金融、汽车金融、小额贷款、保险公司、运营商、政府机构、数据公司等组成。

数据源商户 数据源的供应商也是公信宝的商户,是一个可以销售数据的商户。

联盟 联盟指的是在相同行业领域下交换各自数据的商户形成一个联盟,联盟内的数据只有联盟内的成员才可以交易。

联盟成员 联盟成员是联盟的每一个商户,联盟中的成员各自都拥有同样数据类型,他们既是卖方商户也是买方商户。

白名单 每个联盟都通过一种白名单机制来控制可交易成员,白名单里的成员都是可以交易的联盟成员,添加进白名单的商户则自动成为联盟成员。

黑名单 列入黑名单的商户无法参与任何交易。

智能合约(Smart Contract) 一个智能合约是一套以数字形式定义的承诺(promises),包括合约参与方可以在上面执行这些承诺的协议。在公信宝数据交易所的智能合约由数据购买请求者发起,智能合约里约定了购买数据的类型、身份、价格、最大条目、最大价格等条件,智能合约发出去之后会被广播到拥有该数据类型的数据源节点,如果数据源拥有该数据则可以对此智能合约进行回应,如果最终合约被匹配,则数据交易达成。

三.⽬前数据交易领域存在的问题及业务痛点

1.数据沉淀问题

⽬前市⾯上常⻅的数据交易平台(或称数据交易所)都有 “数据沉淀”的⾏为,数据沉淀指的是原本数据交易平台⾃身是没有数据的,通过代理销售数据源的数据,以 API 接⼝的⽅式对外提供服务,销售⼀条缓存⼀条,慢慢就形成⼀个较⼤规模的缓存数据库,今后销售同⼀条数据不再请求数据源,⽽是数据交易平台⾃⼰从缓存数据库中读取并销售。 这样的⽅式意味着数据源在⼀个平台同⼀条数据只能销售⼀次,不仅侵蚀了数据源的利益,⽽且数据确权和追踪溯源都⽆法保障,更严重的是很多数据交易平台的安全意识较薄弱,缓存数据库往往会被⿊客盯上后被窃取,造成数据泄露。

以互联⽹⾦融领域为例,⾦融履约数据的数据交易交换需求⾮常强烈,但如果有数据交易平台沉淀他们的交换数据,则是所有互联网金融公司所担忧的,未来如果有⼀天数据交易平台极有可能自己做贷款做⾦融,等同于⼤家培养了⼀个最⼤的竞争对⼿,由于⾦融履约数据往往涉及个⼈敏感数据,如果让数据交易平台沉淀数据后随意买卖或者造成数据泄露,后果则⾮常严重。

2.不注重个⼈隐私保护的问题

我国征信⽴法中⾄今仍有许多重⼤的问题尚未形成统⼀的认识,尤其是个⼈征信体系⽴法问题还存在很⼤的争议,⽐如个⼈隐私的范围鉴定、征信公司的资质审核等,因此对个⼈隐私保护除了要有法律法规配套还需要持续性的监管。⽽在这⼀切都还没出台之前, ⽬前的数据交易市场,涉及到个⼈隐私的数据根本没有得到本⼈的同意就已经被随意买卖, 加上近⼏年互联⽹⾦融的⽕爆,直接带动了个⼈数据的⽕爆交易,这背后是巨⼤的市场规模。

3. 数据新鲜度不⾜和造假问题

以互联⽹⾦融履约数据为例,⽬前已有的数据交易平台或⼤数据公司因为都存在“数据 沉淀”问题,所以⼀般⾦融服务公司都不会直连这类数据交易平台提供数据源,更何况很多的数据交易都不注重⽤户授权,所以数据源都不太敢提供实时数据给数据交易商,可能拿 到的是⼏个⽉或者⼀年前的数据,所以也就造成了数据新鲜度不⾜的问题,甚⾄很多数据 更是直接来⾃于⿊市倒卖,在这样来源不明的背景下销售的数据难免不让⼈觉得数据有造 假嫌疑。 参考⼀本财经公众号发布的⽂章《征信之乱:⼀家公司⿊市盗卖上亿数据,如今估值 ⼏⼗亿》。

四. 互联⽹⾦融⾏业的数据交易机会

当前⾦融履约数据的交易市场还是处于⼀⽚混乱的状态,并没有⾮常好的解决⽅案, ⾸先国家公权⼒部⻔(中国⼈⺠银⾏征信中⼼)并没有去统⼀采集、评估这些数据,所以⽹络贷款和消费⾦融⾏业都依靠征信服务机构(征信服务公司、⼤数据公司、信⽤评分公司) 的“⼩规模”数据在做信⽤评估,不仅数据新鲜度差,⽽且数据真实程度也有待确认,⽹上早有爆料⼤部分征信公司都是从⿊市的“中间⼈”购买个⼈征信数据,⽽⿊市的数据掺⽔严 重,造假⽐例甚⾄⾼达 90%。除了从⿊市购买数据外,征信服务公司还会代理销售其它数 据源的数据,每代理销售⼀条数据就缓存⼀条(数据沉淀),这是⼀种典型的中⼼化数据 交易思路,数据源每⼀条数据只能卖⼀次,今后的收益不再归数据源企业所有,极⼤的伤 害了数据⽣产者的权益,征信⾏业迫切需要⼀种既能解决数据质量问题同时⼜要保护数据 ⽣产者权益的完美解决⽅案。 不仅如此,⾦融⾏业的 “信⽤数据孤岛”问题还没有得到解决,平均每天全国 3 万多家 ⽹络贷款、消费⾦融、⼩额贷款公司会产⽣千万条贷款记录、还款记录、逾期记录、⿊名 单等⾦融履约数据,这些海量数据还没有发挥它应有的价值,如果能够联合全⾏业的企业 形成⼀个良性健康的数据交换平台,将会为联合授信、控制贷款杠杆,降低坏账提供巨⼤ 的帮助,造福全⾏业全社会。

五.公信宝去中心化数据交易所产品介绍

公信宝数据交易所是⼀个基于区块链的去中⼼化数据交易所,将做到以下三点:

1、不缓存沉淀数据源的数据;

2、注重个⼈隐私保护;

3、最⼤程度保障数据版权和新鲜度

1.业务流程说明

上图表达的是公信宝数据交易所⼤致的⼀个流程,由于画图画的太详细显得很臃肿, 所以隐藏了部分细节,下⾯⽤⽂字描述: 公信宝数据交易所的所有数据交易都是在真实场景发⽣的,以下举⼀个场景说明: ⽤户 A 向⼀个商户 B(⾦融服务公司)申请消费分期(上图的购买数据商户),该商户 受理这个申请后,由于缺少⽤户 A 的个⼈信息,于是向公信宝数据交易所发起购买数据的请 求(请求即智能合约,商户 B 的系统通过调⽤安装在⾃⼰公司服务器上的公信宝客户端的提供 API 接⼝发起),交易所客户端会判断该请求购买的是否涉及个⼈敏感数据,如果判定是 敏感数据则触发个⼈隐私保护机制,向⽤户 A 发送⼀条短信或者推送⼀个消息给⽤户 A 的公 信宝 APP(如果已经安装),向⽤户申请授权查询,如果⽤户 A 拒绝了这次授权,则流程结 束,商户 B⽆法购买此数据。假如⽤户 A 同意这次授权(正常情况下都会同意的),交易所 则⼴播此智能合约到所有拥有这类数据类型的数据源商户客户端节点,每⼀个节点根据智 能合约的条件查询,如果数据源没有⽤户 A 的数据,则该节点可以忽略即可,如果有则使⽤ 通过⾮对称加密数据点对点传输给商户 B 节点,商户 B 则根据智能合约的规定⾃动⽀付代币 给数据源,商户 B 最终拿到⾃⼰所在节点解密后的源数据进⾏加⼯利⽤。

备注:业务流程过程中的密码学过程参考 6.4 说明。

2.产品特点

不缓存沉淀交易数据

公信宝采⽤的是基于区块链的去中⼼化交易技术,在交易过程中不存在任何第三⽅, ⽽是为所有交易者建⽴⼀种点对点交换的场景,例如:当 A 商户(请求者)发起⼀笔数据交 易请求时(即智能合约),该智能合约会⼴播给全⽹的商户节点(B\C\D…),如果 B\C\D 等任何⼀个节点有数据的话,直接点对点传输给 A 节点,A 节点⾃动⽀付代币给卖⽅ 商户。整个传输过程采⽤⾮对称加密通道,除了 A 之外任何第三⽅截取该数据包都⽆法解密, 保障数据安全。除此之外,公信宝数据交易所提供的是⼀个交易通道,区块链上仅存储数 据交易摘要、凭证、数字版权以及其它交易所需要依赖的⼀些基础信息,并不保存交易的 源数据和加密后的源数据,所以并不会出现有⼈同步所有账本后进⾏强⾏破解⽽得到数据 的可能性。

注重个⼈隐私保护

交易所⾥交易的个⼈数据都需要得到本⼈的授权确认,联盟成员在交易所购买个⼈数 据的初衷是为了获得个⼈的更多信息,以便于掌握该⽤户的贷款杠杆和⻛险,但这项交易 依然事关个⼈隐私,只要是个⼈隐私数据都需要获得本⼈的同意,公信宝的做法是当购买 ⽅发送智能合约请求购买数据,公信宝数据交易所会做⼀次拦截,判断该智能合约要购买 的数字资产是否涉及个⼈隐私,如果涉及个⼈隐私,个⼈⽤户会收到⼀条⼿机短信,如果 安装了公信宝 APP 则会收到⼀条确认授权推送(授权记录将写⼊区块链),授权同意后此智 能合约才会⼴播全⽹进⾏查询和交易。 公信宝除了要解决⾦融领域获取个⼈数据难的⾏业痛点问题,还将致⼒于保护个⼈隐 私,我们坚持认为个⼈的信⽤应该由个⼈来管理,任何⼈或机构使⽤都需要得到本⼈同意 备注:个⼈⽤户可以安装公信宝 APP 管理⾃⼰的信⽤(⾮强制安装),注册时需要提供 身份证、姓名、⼿机号、银⾏卡等身份验证,验证本⼈身份后,会向公信宝区块链注册身 GONGXINBAO BLOCKCHAIN 公信宝区块链 BD@GXB.IO 12 杭州存信数据科技有限公司 份,会⽣成⼀对专属的秘钥,今后所有查询该⽤户数据时,都会推送消息给公信宝 APP 或者 ⼿机短信来进⾏授权确认。

数据版权认证:数字资产所有权认证

前⾯我们讲到很多数据交易平台和征信公司在销售数据的同时⾃⼰会缓存沉淀⼀份, 今后这条数据就可以⾃⼰卖了,这样⼀来原本数据源⼀条数据只能销售⼀次,⾃⼰的权益 ⽆法得到保障,更是⽆法确权和追踪溯源,通过公信宝的数据交易所交易后,不仅不会沉 淀数据,今后买⾛这条数据的⼈再次将数据放到交易所交易,收益依然归原⽣产者所有, 这得益于公信宝交易所的数字资产所有权认证(DPO- Digital Proof of Ownership)。 DPO 是公信宝区块链对数据这个特殊的资产进⾏版权认证的技术控制⼿段,当⼀个数 据交易智能合约⽣效后,这条数据就会被打上⼀个永久数字证书,⽤来证明数据的⽣产者, 今后这条数据产⽣的价值收益权永久归⽣产者所有,这⼀点更是实现了数据的确权和溯源。

双向匿名设计
由于区块链的账本是公开的,任何交易都可以追溯,但是在数据交易领域是有⼀定的 匿名需求的,这个就需要对区块链做⼀定的交易匿名设计,以互联⽹⾦融的企业为例,他 们有⾮常强烈的数据交易匿名需求,买⽅不喜欢其它商户知道⾃⼰买了具体什么样数据, ⽬的是不喜欢其他⼈逆推出⾃⼰的征信模型,卖⽅则不希望其他⼈知道⾃⼰销售了什么数 据,⽤于保护⾃⼰企业的经营隐私(例如贷款余额多少、坏账率多少、实际利息收多少 等),公信宝可以对每个参与数据交易的联盟成员在区块链上实⾏双向完全匿名记账(可 以配置是否需要匿名记账),也就是说不仅不知道数据交易给哪个商户,对⽅也不知道数 据从谁⼿⾥购买的,从⽽彻底保护交易双⽅的隐私。

信⽤贡献证明机制(PoCS):体量悬殊的联盟成员可平等交换数据

在没有⾮常好的共享信⽤解决⽅案之前,体量悬殊的企业⼏乎不可能进⾏交换,原因 在于对数据体量⼤的企业来说不公平,同时⼤公司也不是很在乎单个⼩公司的数据量,所 以让他们之间建⽴交换是在太困难了,虽然⼤公司会忽视单个⼩公司的数据,但如果有 100 家甚⾄1000 家⼩公司组成的数据规模就不可⼩视了,所以为数据体量悬殊的它们建⽴⼀个 公正公平的共享信⽤交换体系实在是⾮常重要。 公信宝独创的信⽤贡献证明共识机制 ( PoCS - Proof of Credit Share )将彻底解决这 个问题,我们将每⼀项数字资产以及字段进⾏标准定价(后续资产价格的涨跌由理事会投 票和市场表现综合决定),每⼀条数据被查询并交易成功,则计算⼀次贡献(Share,类似挖矿的算⼒贡献),数据量越⼤的联盟成员被交易的可能性越⾼,也将产⽣更多的贡献, 贡献越多将得到的公信币奖励,也就意味着贡献越多可以换回更多的数据,⽽数据量⼩的 联盟成员相对可能产⽣较⼩的贡献,如果希望换回⾮常多的数据,那需要购买⾜够的公信 币才能达到这个需求,所以在这样⼀种按照贡献值来计算的共识机制下,联盟成员就可以 在⼀个公正公平的共享信⽤交换市场中愉快的做⾃⼰想做的事情。.

3.⾃由市场(Free Markets)和联盟市场(Alliance Markets)

公信宝数据交易所的交易所市场分为以下两种市场:

⾃由市场(去中心化的数据交易天猫)

这是一个 B2B 的数据交易市场,卖家均为权威的一手数据源,买家则是有数据采购需求的企业,卖家将数据项合理定价后在公信宝数据交易所上架数据,任何⼀名不在⿊名单的商户都可以调⽤接⼝购买数据。

联盟市场(各行各业的数据共享交换平台)

相对于⾃由市场来说,这是⼀个有准入门槛的市场,公信宝为不同的数据类型或者不同垂直领域的商户建⽴⼀个个联盟,甚⾄也可以为同⼀个领域拥有相同数据类型的商户建⽴不同的联盟,这都是为了不同权限的需要,例如⾦融共债数据共享联盟,贷后黑名单共享联盟。 每⼀个联盟市场的成员前提⾃身具备⽣产该类型数据的能⼒,同时⼜有购买该类型数据的需求,可以和联盟内的其他成员进⾏有效的交易交换,并最终形成⼀种健康的数据共享交换联盟,联盟市场内的不同数据单价由联盟内成员共识协商定价。

4.不会挑战国家征信管理条例

业内对征信数据处理最深层的担忧,在于其挑战违反个⼈征信管理条例的属性,会得 到监管机构的⼤⼒排斥和法律问题,公信宝数据交易所不沉淀数据,不加⼯数据,不提供 数据评估报告,涉及个⼈敏感数据都需要得到本⼈的授权确认并记录到区块链,不会触犯 个⼈征信管理条例。通过区块链点对点的数据交易,⼀举打破线下⿊市交易混乱的现状, 将联盟成员合理合规的数据共享建⽴⼀个⼀个公平公正的交易交换平台。

5.数据造假问题控制

当前个⼈征信数据的线下交易繁荣,⼯商、身份信息、⻋辆、房产、电商交易、银⾏、 运营商尤为抢⼿,但⿊市市场渗⽔严重,为了获得超⾼利润,数据造假⽐例已经达到 90%, 这说明不仅数据新鲜度不够,⽽且数据的真实性也是⼤打折扣。

公信宝数据交易所从以下⼏个⽅⾯遏制数据交换中的造假问题:

准⼊⻔槛:⽽⾦融履约数据以及很多维度的数据是爬⾍采集不到的,就需要联盟成 员之间来进⾏相互交易,公信宝对联盟成员做好严格准⼊,仅限拥有该数据⽣产能⼒的商 户加⼊联盟。

投诉机制:商户通过交易所购买到数据,在实际使⽤过程中发现偏差很⼤或者完全 就是假的,可以通过交易所投诉,投诉后会被⼴播并同步到全⽹,这些投诉将会永久存储, 如果收到的投诉过多,不仅会影响商户的正常交易和信誉,还将受到严厉的处罚。

个⼈检查:前⾯我们说到要购买涉及个⼈隐私的数据需要得到本⼈的授权同意,个 ⼈同意后智能合约才会⼴播,此智能合约最终收到购买到的数据,个⼈⽤户的公信宝 APP 或 者短信都可以看得到,允许个⼈检查数据的真实性,如果对此存疑,可以提交质疑。

处罚机制:收到⼀定量的投诉和质疑以及交叉验证判断出来的造假机率,这些信息 将会换算成负贡献值(-Share),负贡献值将会抵消贡献值(Share),也就是此联盟成员今后 需要产⽣更多的贡献才能消除此负贡献值,才未消除负贡献值之前,所有的收益将会进⼊净⽹委员会账户,⽽被-Share⾮常严重的联盟成员,将会直接封停状态,冻结所有公信币资⾦。

备注:净⽹委员会账户收益将⽤于奖励每季度表现排名靠前的成员以及对净⽹产⽣重 ⼤贡献的成员,会定期公布。

6.如何解决区块链区块太大同步慢的问题

公信宝采⽤以下两种⽅式解决数据膨胀问题:

公信链采用全节点区块同步和功能分离的设计,重钱包(witness_node)同步区块,轻钱包(gxb-light)与数据交易盒子(gxb-box)对接功能和业务,需要同步全部账本的节点可以运⾏witness_node,这是一个全节点区块客户端,而需要交易数据的商户只需要使用 gxb-box,这个不需要同步区块就可以立即使用,gxb-box 可以链接到任何⼀个 witness_node,同时做到自动检测最优节点、断线重连机制,确保数据交易网络通畅。
当然如果有些商户希望同步全区块,则可以在商户⾃⼰的服务器上安装 witness_node,让 gxb-box 优先链接上这个 witness_node 即可。

公信链上仅存储数据交易摘要、凭证、数字版权以及其它交易所需要依赖的⼀ 些基础信息,并不保存交易的源数据和加密后的源数据,不仅缩小了交易的⼤⼩,也杜绝 了爆破加密算法后得到账本数据的⻛险。

7.如何通过密码学的⽅式来证明公信宝不缓存沉淀数据

我们以⼀个数据购买者节点和数据源节点的数据传输为例来解释这个问题:

购买数据的商户 A,对智能合约进⾏私钥签名(私钥上商户在⾃⼰的客户端按照⾃⼰的 ⽅式⽣成的,它⼈⽆法得到),发送时携带⾃⼰的公钥,通过交易所客户端⼴播给全⽹节点,上图中的数据源商户节点收到了⼴播,调⽤数据源的数据接⼝查询,如果数据源查询 到数据,则使⽤A 的公钥对源数据进⾏加密后点对点传输给 A 的客户端节点,A 使⽤私钥解密得到源数据。 整个过程采⽤⾮对称加密,加密数据使⽤的是 A 的公钥,⽽只有 A 的私钥才可以解密,即使过程中数据包被它⼈截获,都⽆法解开数据(即使公信宝截获数据包因为没有私钥同样解不开),彻底保障数据交易过程中的传输安全。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

上一篇:

下一篇:

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

关于作者

JSmiles

生命进入颠沛而奔忙的本质状态,并将以不断告别和相遇的陈旧方式继续下去。

0 文章
0 评论
84961 人气
更多

推荐作者

亚希

文章 0 评论 0

cyp

文章 0 评论 0

北漠

文章 0 评论 0

11223456

文章 0 评论 0

坠似风落

文章 0 评论 0

游魂

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文