算法源于大数据,而大数据源于我们每一个人,那我们是不是应该拥有主导数据的权利?
作者:啊啊啊啊啊 时间:2018-10-25 09:10:59
本提问为「知乎 2018『互联网洞见者』」十个提问的第二问,由今日资本创始人兼总裁徐新(知乎 ID : 徐新)提出。更多详细信息,请点击进入「互联网洞见者」专题知乎 2018「互联网洞见者」event.zhihu.com作为风险投资人,我对算法的感受是:非常厉害,无处不在。人的天性是懒惰的 (the law of least efforts), 我己经看到这个可怕的趋势:人们好像更愿意让算法帮助决策。而那些拥有大数据、拥有算法的超级大公司,他们可能会通过算法主宰我们的…
回答 (2):
-
王瑞恩 2018-10-25 09:10:59 法律工作者已经在试图回答这个问题了。例如,欧盟《一般数据保护条例》明确了“被遗忘权”(Right to be forgotten)。当个人数据已经过时,不再属于满足一开始获取时的合法目的所必须,或者数据提供者撤回了最初提供数据的授权且无合法理由继续保留数据时,个人有权要求掌握数据一方删除或不再使用该数据。可以想像一个场景:唐某十年前在某招聘网站上传简历,授权网站基于简历中的信息为自己推荐岗位,该简历中包含自己从事销售员的信息。后来,唐某前往美国名校深造,时来运转,摇身一变成为职业经理人。如果适用《一般数据保护条例》,那么唐某或许可以要求招聘网站删除自己所提供的信息。这样看来,唐某的确可以“主导”网站用于提供个性化服务的数据。--但类似的法律适用范围依然非常狭窄。每天,我们都在无意中产生大量数据,却既不知道数据被如何使用,也不知道自己能够主张何种权利。例如,出行软件可能会使用我们的位置信息,来决定是否上调某一区域的叫车价格;类似地,地图软件也可能基于用户的位置,判断道路拥堵情况。这些使用方法,可能包含在软件使用协议里,但不具备专业知识的用户可能无法理解。--不理解,尚且可以通过合同法获得法律救济。如果服务提供商对数据的使用超过了用户协议所约定的范围,或者滥用格式条款、迫使用户接受显失公正的数据使用方式,那么可以基于合同法提起诉讼。但有的时候,数据的使用方,或许和数据的提供方并不存在法律上的关联。例如,某设计公司通过分析合法途径获得的街景照片,分析行人服装样式,判断当季流行趋势。路人和公司之间并不存在权利义务关系,无从在法律意义上“主导”设计公司对“衣着数据”的使用。--法律无法给出回答,可能是因为立法者是大数据时代的“移民”,法律制定所依赖的土壤,依然是我们更加熟悉的“小数据时代”。何为“小数据时代”?再举个例子:年纪大一些的朋友可能还用过电话黄页,里面收录了商家和各类机构的联系方式。立法者对黄页中的数据并没有迟疑,可以很清楚地回答:黄页的编纂者并不享有著作权,因为整理收录公开信息并不能体现原创性。对于电话号码和地址这样的“小数据”,立法者在界定权利方面没有丝毫迟疑。但到了大数据时代,问题就不这么简单了:有的网站,可以海量抓取公司的工商登记信息、涉诉信息、在媒体上的曝光记录等,基于算法对公司的的信用给出评分。对于这样的大数据版“黄页”,制作者是否享有著作权?基于算法给出的评分,能否体现独创性?这些问题,小数据时代的法律就难以应对了。--很遗憾,我无法给出明确的回答,只能和提问者一样,对未来继续怀有好奇与期待。--(注:回答中提到的人物和机构均为虚构,其中有的技术手段,以我的知识范围无法确定在现实中是否存在,仅仅是一种想象。)
-
苏莉安 2018-10-25 09:10:59 用户数据隐私和归属权的问题真正被公众重视起来也就是最近十年左右的事情。刘慈欣2008年的《三体II:黑暗森林》里还有这样的描述:走了不远,罗辑突然听到一个柔美的女声:“是罗辑先生吗?”他四下一看,发现声音是从路边草坪上的一个大广告牌上发出的,广告牌上的大幅动态图像中,一个身穿制服的漂亮姑娘正在看着他。“我是。”罗辑点点头说。“您好,我是总体银行系统8065号金融咨询员,欢迎您来到这个时代,现在向您通报你目前的财政状况。”咨询员说着,她的旁边映出了一个数据表格,“这是您在危机第九年的财政数据,其中包括当时在中国工商银行和中国建设银行的存款情况,还有当时的有价证券投资情况,后面一项的信息在大低谷时代可能部分丢失。”“她怎么知道我在这儿?”罗辑低声问。史强说:“你的左手臂里植入了一块什么芯片,不要紧张,现在每个人都有,类似于身份证吧,所以广告牌能认出你来。现在的广告都是对着个人了,不管走到哪里,广告牌上的东西都是为你显示的。”放纸巾的盒子被激活了,一位漂亮女孩儿在上面向罗辑推销创可贴,她显然通过他今天的经历,推测他胳膊腿上可能有擦伤。“天啊。”罗辑感叹道,把纸塞回盒子里。“这他妈才叫信息时代,咱那会儿,有点儿原始了。”大史笑着说。当年大家对这样的高科技未来世界不仅没有忧虑和恐惧,甚至还很向往。什么时候发生了转变呢?大概就是「我真的有一头牛」之后吧。随着移动互联网的大规模普及,我们的日常行为、浏览习惯、甚至只言片语都可能被记录分析,再以此为依据推荐专属的资讯时,质疑和危机感就开始逐步加剧了。很遗憾的是,数据的归属问题很可能永远是无解的。企业和用户、政府和企业、政府和公民、法律和利益之间会不停地扯皮下去。甚至在追求便利与追求安全、隐私、中立的用户之间也一样会产生矛盾。许多人刷抖音、今日头条「停不下来」,就是因为人家收集了你的大量浏览数据后投其所好,不停为你推送同类或相近主题的内容。微博、Twitter、Facebook都尝到了算法的甜头,开始打乱时间线,猜测你想看什么并进行推荐。用户的抱怨没停过,但互联网巨头们并不在乎,因为数据和广告收入的增长是肉眼可见的。有没有不交出自己数据,完全独立自主控制自己想看什么的产品呢?有。十几年前最流行的RSS阅读就是这样的东西,你选择订阅哪个新闻频道、哪个博客、哪个专栏都是自由的,连推荐位都没有,必须亲自把对方的RSS feed地址粘贴进来。然而后来便捷的社交网络战胜了事事亲力亲为的RSS。随着Google Reader轰然倒下,愿意掌控自己信息主导权的群体已经彻底沦为小众。大多数人选择了轻松快捷地滑动手机,看着被筛选过的、只针对自己爱好的新闻与广告。举一个就在身边的例子:几乎每隔几天就会有人吐槽知乎推荐算法太差劲,经常推荐一些无聊的、低质量的、不爱看的答案,远不如自己的关注者时间线好看。看清楚啊,大家抱怨的是知乎为什么不懂我,为什么算法做得不够好,不像头条、抖音那样知道我爱看哪些东西;而不是知乎通过分析用户画像推荐内容这件事本身不对。明白了吗?如果能为自己带来便利的话,大多数人真的是没那么重视数据隐私的。说到这里,有人大概会想起之前李彦宏「中国人愿意用隐私换效率」的言论被喷,那这里为什么得出一个同样的结论呢?因为百度被喷的原因恰恰不是算法和AI,而是人为加入的垃圾和诈骗广告。换句话说,如果它真的收集用户信息后通过纯粹中立的算法进行分析并推荐,我们反倒不会那么反感了。而在「貌似中立」中掺入了人为的广告(而且无底线),才是令人无法忍受的。那么结论大概是:少数小众用户会拒绝通过分享个人隐私带来的便利,并质疑其危害;大多数人则愿意这么做,除非便利不够(如知乎),或者危害太严重(如百度)。换句话说,大家觉得「AI本身会带来隐患」这件事还不够真实感,太未来了、太科幻了,因此接受程度还算挺高的。我们愿意(部分地)被机器影响决策,却极度反感被其他人偷偷影响。