未来已来:大数据时代,如何操纵数据安全的主动权?
“我们可以从信息空间中
去改造一个物理空间”
ASP站长网2020年8月,创新工场董事长兼CEO李开复在一场活动中表示:新冠疫情正加速社会“AI化”。而“人工智能”,这个早在1956年就被提出,经历了相当一段时间低潮期的学科,正迎来前所未有的高潮。中国第一批投入人工智能方向的专家,中国工程院院士、国家新一代人工智能战略咨询委员会组长潘云鹤曾提到:新一代人工智能最本质的改变之一,是在原本的人类社会空间,和物理空间的基础上,增加了信息空间。
潘云鹤:比如说交通问题,过去我们只能够看到一个十字路口的变化,现在我们可以在信息空间里看到这个十字路口的变化,是怎么去影响周围四个十字路口的变化。不但可以看到它,而且可以改造它。我们可以从信息空间中,去改造一个物理空间。比如说,以前做一次人口调查要半年,需要成千上万个工作人员。五年以后我们再做一次人口调查,也许几个星期、几百个人就够了。当我们把大数据收集起来,例如户口大数据、电子购物大数据、医疗大数据等等,就可以给每一个人进行画像。
以前的人工智能,基本上是基于知识的人工智能。现在的人工智能实际上不再基于知识,而是基于数据。它们的不同之处在于,它能够自动地把数据变成知识。所以我们把它取了个新的名字,叫“大数据智能”。
另外一个非常重要的方向就是,老一代人工智能的目标,是想把机器人做好,造出越来越有用的机器人。那么新一代人工智能,不但要把计算机变得更聪明,而且应该把计算机和人连在一起,把它合成一个更加聪明的智能系统。
潘云鹤:我们现在遇到的数据,很多是很差的大数据,质量上面非常差,而且有的数据太偏,数据不完整。比如我拿到了很多数据,只是一个方面的,另外一方面的数据根本就没有,这些问题都会反映到最后形成的知识水平上面来。那么人为什么会逐渐地进行进化呢?就是因为人能够用学到的东西,去指导后面的大数据智能,他能够不断积累。现在的人工智能也能自己成长,但是它知识不够完整,它只能在那个圈子里成长。如果我们把知识再扩大一块,比如把人大脑中间的形象知识包括进去,让计算机能成长起来。
吴小莉:您觉得这个过程要多久?
潘云鹤:我估计大概要一、二十年。
大数据时代
该如何掌握数据安全的主动权?
方滨兴:大数据、人工智能的处理能力,前提都是要有原始的数据。数据为王,谁拥有数据,谁就是王。为什么欧洲有GDPR(通用数据保护条例),就是因为他们没有强大的服务能力,所以它会对别人的服务高度担心。如果它自己有这么大的企业,它可能也不会有这么多的担心。但现在它的全部数据都是在美国,所以他们就要有一个特别强硬的法律,来对它们加以限制,来保护自己。美国确实太强大了,它们基本上“吃遍”了全球。
我们看回中国的例子,原来别国的产品想要入驻中国时,中国说你可以运行,但是必须按照我们的要求进行管理,比方说,有害信息你不能跟着传播等等。但是它不接受,它说那我就不进了。那现在看来,中国就跟着起来了,中国就出来了百度、微信了。
吴小莉:BAT(百度、阿里巴巴、)。
方滨兴:所以从这方面,等于无形中让中国自己的产业做起来了。因为这个产业,它构成的是一种服务中心,这种服务中心能够获取一个国家的很多的核心信息。
国内开源生态 正在建立中
如今,各类创新应用场景催生出多样化的数据,使得业界对提出一种全新计算架构的呼声愈来愈烈。随着算力成为大数据时代各国的核心竞争力之一,巨型科技公司也逐渐开始自建能力开源。鹏城实验室主任、中国工程院院士高文提到:利用开源平台集合众人智慧,是推动软硬件智能化升级的重要一环。
高文:说到人工智能,它现在是叫“机器学习框架平台”。现在就有好几个版本, 国际上影响比较大的包括谷歌、亚马逊、Facebook、IBM、微软。它把人工智能的源程序都放在自己的开源框架里,供别人下载,如果别人再往上加东西,就需要再放回去。现在影响最大的是谷歌的,所有的大学、中学都在上面玩,所以它这个东西就会越滚越大。
吴小莉:其实开源开放的平台的优势在什么地方?
高文:开源其实是软件领域发展的一个新做法、新文化。以前软件都是卖版权的,比如我设计的软件,你想使用就需要支付版权费。但是大概三十多年前,MIT的一些教授就开始倡导开源软件。就是下载我的软件,是有许可证的。许可证要求的是你下载后,如果对这个软件有任何修改的地方,需要放回来。
在国内,其实二十几年前也很倡导这个东西,这个是有一个很好的案例,就是华为的案例。华为有一段时间,就是从网上拿来版本后,有一些人就提出,我们自己开发就可以,也不用拿出去了。另外一些人就说,我们应该交回去,按照许可证的要求来做。所以华为内部就说,那既然你们两方谁也不服谁,就按照各自的方案走一段时间,然后两边就开始铆足了劲干。半年以后,私有的那个团队跟不上了,另一个写了往回交的团队,还在往上升。所以开源就是一种文化,软件是一种文化。
目前在全球范围内,美国拥有数量最多、应用最广的AI开源平台,在深度学习框架和大部分应用领域均处于领先地位。但是近年来,中国在计算机视觉、智能语音、中文自然语言处理、无人系统等领域的开源平台,也逐渐在国际上占据一席之地。
9月18日,2020中关村论坛“AI开源创新与产业智能化”平行论坛举行。中国科协学会学术部部长刘兴平在致辞中提到,开源的应用已经突破了单纯的技术层面,成为跨国界大规模协作生产方式的代表。
人工智能不仅要有“智”
更要有“德”
2020年的新冠疫情,让本已参与在各行各业的AI技术迎来风口。无论是业界还是学界,都对人工智能人才求贤若渴。世界工程组织联合会主席龚克提到:顶尖人才缺口大、人工智能人才培养的体制不够灵活,同样限制了中国的人工智能产业发展。另外,他也提到,虽然人工智能已经诞生了63年,但是中国的人工智能技术的发展顶多只有十几岁。中国在人工智能技术方面的基础算法、基础研究的积淀与美国相比,仍存在着比较大的差距。
(编辑:焦作站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |