- A+
雍和比特币 就连参与2020年美国总统大选的华裔民主党提名人杨洁篪(Andrew Yang)也表明,“数据比石油更有价值”,这说明这一理念根深柢固。
可是,虽然说“数据是数字年代的石油”和“咱们应该把数据的一切权把握在自己手中”听起来很有吸引力,但很难说咱们应该坐山观虎斗完成这一方针。早在2017年,券商学者就宣布封面文章,称“数据将代替石油”,成为年代最名贵的资源。但即便在今日,具有“数据油”主权的一般民众依然无法从这一名贵资源中获益。相反,这些数据也给其一切者带来了严峻的隐私走漏问题。为什么愿景和实际之间有巨大的距离?坐山观虎斗完成数据一切权和数据价值?本文企图从现有的实践中进行探究,期望能厘清一些头绪,有助于树立关于这一问题的考虑结构。
咱们不能卖数据我信任咱们每个人都有接到出售电话的经历。绝大多数人的个人材料都被生意过,最简略的如电话号码和一些顾客信息,这些材料现在或许正在某处等候再次出售。数据的确能卖钱,并且钱会进入有权拜访咱们数据的安排的口袋。这种现象简略导致一种误解,即咱们可以经过出售数据来完成数据的价值。也便是说,在咱们有了数据主权之后,凭借法令规定和技能手段,咱们可以经过把这些数据卖给有需求的人来取得数据价值,把“石油”卖成金钱。但这是过错的。咱们不能生意数据。在论述这一问题之前,有必要差异数据的一切权和运用权。对国际上绝大多数财物而言,生意行为是指财物一切权的搬运:一方取得一切权,另一方损失一切权。但生意数据不会搬运数据的一切权。您出售数据,但数据的一切权依然归于您。因而,环绕数据的生意实际上是环绕数据的运用权,而不是环绕数据一切权的生意。但因为数据可以无限仿制,假如咱们出售数据,就不能保证买家会坐山观虎斗运用,是否会再次出售。更精确地说,在某种程度上,咱们现已“丢掉”了数据,即便咱们具有数据的一切权。不合法数据生意将直接生意数据,因为他们不关怀数据一切者的权益。可是,当咱们真实具有数据的一切权时,咱们不能为了完成数据的价值而生意数据。那么,坐山观虎斗在不丢掉数据的情况下生意数据运用权呢?答案不是生意数据自身,而是生意数据的核算成果。也便是说,买方可以用这些数据来核算并得到所需的成果,但买方自己不能得到原始数据。这是咱们评论数据一切权和数据价值时首先要了解的,或许也是最重要的一点:咱们不能经过出售数据来完成数据价值,咱们只能经过出售数据成果来完成数据价值。也便是说,咱们应该把数据的一切权和运用权分隔,只生意数据的运用权。隐私核算不只是是针对用户的隐私问题坐山观虎斗完成只卖数据成果?答案是:经过隐私核算。隐私核算是在不露出原始数据的情况下对数据进行核算,并对核算成果进行验证。它包含许多研讨方向,如彻底同态加密、安全多方核算等。有许多专业技能。本文介绍了它们的作业原理。假如你想了解更多,你可以查一下。这儿咱们还有第二个含糊的方面要弄清,即隐私核算不只是是为维护用户隐私而服务的,它是完成数据运用权生意的基础,也便是完成数据价值的基础。之所以要弄清这一点,是因为“隐私核算”很简略被了解为另一种维护隐私的技能,重点是“隐私”。但实际上,“隐私核算”的焦点是“核算”。在区块链职业,因为隐私核算经常被用作加密钱银生意和区块链中增强用户隐私的一种办法,因而人们更简略将隐私核算了解为对用户隐私的一种服务。这种了解并没有错,但它将隐私核算局限于一个小范畴。或许从另一个视点来看待这个问题更为明晰。将数据问题分为用户隐私问题和数据价值问题。用户隐私的问题是与用户有关的原始数据不被发表,用户的隐私不被露出。咱们可以把这一问题看作是一种特定规模内的数据隐私维护。在这个阶段,隐私核算的效果是维护隐私的另一种办法。在用户取得数据隐私后,假如他/企业挑选将数据放在那里而不做任何作业,故事就完毕了;但假如用户/企业想走得更远,取得数据的价值,就需求把数据拿出来运用,作业就会进入下一个阶段。在这个时分,咱们需求运用各种办法来确保数据在运用的整个生命周期内不会被走漏。咱们可以将此视为全方位的数据隐私维护。在这一阶段,隐私核算的效果不再是一种代替办法,而是一种必要的办法,因为完成数据价值的办法是在不露出原始数据的情况下出售数据的成果,并生意数据的运用权。只要隐私核算才干完成这一方针。假如咱们把数据比作石油,那么隐私核算便是提炼的第一步。这是咱们在保证用户隐私的前提下,将“原油”转化为各种产品的基础。并非一切数据都具有类似的值不是一切的数据都有类似的价值,也不是一切的数据都能完成数据价值。这或许是咱们在评论数据值时需求明晰的另一点。只要了解数据的复杂性和多样性,才干在不同的情况下运用法令和技能中不同的术语和办法来解决问题。本文企图从运用的视点对数据类别进行简略的差异,然后介绍这类数据的数据价值。本文提出的数据分类办法并不一定全面、精确,而是为评论树立了一个根本结构。咱们可以将数据分为三类:一是身份数据;二是行为数据;第三类是生产力价值数据。第一类身份数据用于网络和实际国际中的注册和身份确定,如个人信息号码、电话号码、账户信息等。这些信息对不合法职业的价值最大。一旦走漏,也会给用户带来极大的安全隐患。但关于正规的数据职业来说,这种信息没有核算价值,无法核算出有意义的成果。因而,这类数据自身不需求考虑坐山观虎斗经过隐私核算完成数据价值。第二类是行为数据,包含用户在互联网上的阅读痕迹和消费数据,以及用户的产品运用习气等。咱们可以核算这些数据来制效果户的个人肖像,然后依据肖像向用户推送广告、推送内容、供给服务,乃至出售构思。行为数据有两种价值。一是广告的价值。咱们都知道广告简直支撑了整个互联网工业;其次,它可以协助产品了解用户,然后为用户供给更好的个性化服务。现在,国际上广泛重视和评论的数据一切权问题首要会集在这类数据上。长期以来,这类数据的权利并不明晰,人们对此并不关怀。直到这些数据的核算成果越来越多地被用来影响或操控咱们,咱们才认识到问题的严峻性。标志性事情是2018年;Facebook;的数据门事情。在这次事情中,一家名为Cambridge analysis的数据运营公司从超越5000万Facebook用户那里取得了数据。他们经过数据核算,筛选出政治摇晃的目标,并在其上投进精确匹配的政治广告,然后影响美国大选和英国脱欧公投。
好消息是,咱们好像正在回收这类数据的一切权。依据欧盟发布的《通用数据维护法令》(gdpr),生成数据的个人是数据主体,他有权要求删去他的个人数据,也有权对立和中止处理他的个人数据。坏消息是咱们得不到运用这些数据的权利。如上所述,数据的价值是树立在数据运用权生意的基础上的,所以咱们离用这类数据来完成归于用户的数据价值还很远。其困难在于:一方面,虽然gdpr被称为史上最严厉的数据维护法规,但gdpr只要求企业在运用数据之前奉告用户运用了哪些数据以及坐山观虎斗处理这些数据。也便是说,它只约束企业乱用数据,而不约束企业运用数据。另一方面,因为这类数据可以协助产品了解用户,假如企业为了改进用户体会而运用数据,这也是他们现在所做的,好像很难回绝。用户献身用户体会要求企业不运用任何行为数据好像十分困难,但企业自动差异这类数据的两种用处并搬运部分广告价值好像更为困难。
这是否意味着企业依然可以像曾经相同行事?一点也不。咱们会发现,上述数据一切权和运用权的别离只是字面上的。企业虽然只具有数据的运用权,但他们“获取”并运用原始数据自身,使得数据依然存在乱用和安全问题。因为公众隐私认识的觉悟和各国数据维护法的出台,一旦出现问题,企业或许面对用户抵抗和巨额罚款。因而,咱们可以看到,谷歌、苹果等公司都在隐私核算范畴做了很多的研讨。与;谷歌;例如,它的“联邦学习”便是将机器学习模集成到每个设备中,在搜集用户参数并发送到云端时,经过隐私维护聚合算法和系统工程完成隐私核算。但需求再次指出的是,企业经过隐私核算将数据一切权和运用权别离,并不是为了让用户可以生意数据运用权。他们期望下降数据运用的危险,防止隐私走漏的指控,持续免费运用用户的数据,以满意法规遵照性要求。因而,用户获取此类数据的数据价值负重致远,而最大的困难在于感知。只要当咱们有了激烈的数据一切权和运用权认识,才干推进政府出台愈加严厉的数据维护法规,或许推进新的互联网架构推翻当今的会集式服务器形式。“生产力价值数据”是最有价值的在了解了“身份数据”和“行为数据”之后,咱们将介绍第三类数据,本文称之为“生产力价值数据”。这类数据的首要用处之一是进行机器学习和人工智能练习;另一个首要用处是做数据剖析,协助科学研讨、产品设计、决议计划等。假如运用妥当,这种数据可以推进社会朝着更高效、更友爱的方向开展。他们是一种生产力。第三类数据搜集规模最广,数据量最大。它可以来自人类,如个人医疗数据和财务数据、个人产品运用数据等;它还可以来自物联网设备,如传感器搜集的大气数据、自动驾驶数据等。其部分数据来历与第二类数据相同,都是互联网产品的用户,但搜集数据的处理办法和用处不同:第二类数据取自用户,用于用户,第三类数据搜集后跨数据主体运用。从数据自身来看,咱们可以以为某一数据不仅是第二类数据,也是第三类数据。第三类数据具有最大的数据价值。一起,可以首先进入数据运用权生意市场,完成数据价值。与第二类数据不同的是,互联网企业具有数据运用权,一起运用数据,不需求进行数据生意。在生产力价值数据的运用场景中,有一些人物没有运用数据的权利,可是想要运用数据。从这个视点来看,咱们可以以为第三类数据是指一切可以本钱化的数据的调集。咱们可以以医学数据为例,更好地了解坐山观虎斗运用第三类数据。假如科研安排或制药厂能有很多的医学数据支撑,就能更好更快地研讨疾病、开发新药。可是,有数据资源的医疗安排因为用户隐私问题和自身利益,不会将这些数据供给给其他安排。假如咱们经过隐私核算别离数据的一切权和运用权,就可以树立一个数据运用权生意市场,不同医疗安排的数据,科研安排和制药厂可以在这个平台上互联互通——俗话说便是打破数据孤岛——这些安排可以进行数据生意,数据也可以同享用于关节病研讨。要培养出可以确诊疾病的人工智能,还需求经过上述办法打破数据孤岛,为人工智能供给越来越全面的数据。需求重申的是,在现阶段,即便完成了数据的生意和价值,但因为数据运用权的法令和运用鸿沟尚不明晰,咱们作为个人依然难以回收数据的悉数价值。数据一切权和拜访权是这个年代最重要的问题之一。《人类简史》的作者和前史学家尤瓦尔·诺亚·哈拉里(Yuval Noah Harari)以为,“假如咱们想防止财富和权利会集在一小群精英手中,关键是要规范数据获取。”。因为数据自身的复杂性和多样性,与其依托言论、立法和技能全体解决问题,不如从鸿沟明晰、描述精确的小点来界定和解决问题,或许是一种快速有用的办法。咱们可以对不同的数据类别进行更详细的分类和剖析,或许用不同的分类规范来评论数据的分类,然后在此基础上评论数据的隐私性、一切权和价值完成。从头认识“数据便是石油”数据常常被比作石油。虽然有人类在死海沿岸搜集楔形文字的天然石油的记载,但直到1846年亚伯拉罕·蒂斯纳发明晰从煤中提取火油的办法,1853年伊格纳齐·武卡谢维奇和扬·塞从原油中分馏出精制火油,现代石油工业的前史才真实开端。可是,这只是是开端。作为火油灯的燃料,油并不特别。后来在内燃机上运用,才迸发出巨大的潜力,成为国际上最重要的资源。数据和石油之间的类似之处在于只是数据是不行的。只要完成数据的“提炼技能”,才干敞开数据工业年代。数据和石油的差异在于,只要在炼油厂之后才有对内燃机的需求。可是,对数据的需求巨大,但没有老练的技能和基础设施来支撑这一需求。这或许是件功德。路很长,但咱们知道方向。
规范物质:。联合学习:没有会集练习数据的协作机器学习2。协助安排在不搜集更多数据的情况下做更多作业
- 我的微信
- 这是我的微信扫一扫
-
- 我的微信公众号
- 我的微信公众号扫一扫
-






2021年6月3日 下午2:47 沙发
是 2016 年由区块链企业 Stratumn、德勤与支付服务商 Lemonway 合作推出,它允许人们通过 Facebook Messenger 的聊天功能,