《麻省理工科技评论》昨天公布 2018 年“全球十大突破性技术”(10 Breakthrough Technologies),这份全球新兴科技领域的权威榜单至今已经有 17 年的历史。
▲2018 年《麻省理工科技评论》全球十大突破性技术榜单包括:给所有人的人工智能(云端 AI)、对抗性神经网络、人造胚胎、“基因占卜”、传感城市、巴别鱼耳塞、完美的网络隐私、材料的量子飞跃、实用型 3D 金属打印机、零碳排放天然气发电共 10 大突破性技术。
回看过去几年的上榜技术,我们发现一个明显的趋势:越来越多的人工智能相关技术入选榜单,其中包括:2008年机器学习、2009年的 Siri、2013年的深度学习、2014年的神经形态芯片、2016年的语音接口与知识分享型机器人,以及 2017年的自动驾驶卡车与强化学习。
2018 年,我们在人工智能领域看到最具开创性的突破点,就在于人工智能将脱离需要大量资料喂养设定的框架,取得足以自行演化出更精细结果的能力。我们认为,今年最具突破性的人工智能技术是对抗性神经网络(Dueling Neural Networks)/ 对抗式生成网络(GAN)——通过两个 AI 系统的竞争对抗,极大化加速机器学习的过程,进而赋予机器智能过去从未企及的想像力。
另一个同样在 2018 年入选榜单的人工智能技术则是:“给所有人的人工智能”——云端 AI,足以让深度学习算法变得像微博一样简单易用。
回顾人类历史发展的过程,越是先进的技术,越是被少数人控制掌握,也越容易成为操纵垄断的工具,但今年入选的这两项人工智能技术的重要性,就在于破除过去的陈规旧习,达成用 AI 技术普惠人类世界的愿景目标。
技术的强大和普及,将促进相关领域科研及社会经济的发展,但不可讳言的是,技术发展带来的负面影响也不容忽视,比如 GAN 能创造出以假乱真的图片及视频来混淆视听,这是伴随技术突破发展而来的全新挑战。因此,对于一手打造 GAN 技术的 Ian Goodfellow 而言,他当前的研究重心就在于 GAN 滥用问题,就如同父亲对待孩子一样,希望 GAN 技术不至误入歧途。
▲Ian Goodfellow
在 2018 年的榜单中,类似 GAN 这种“亦正亦邪”的技术不止一个,在生物医疗领域的“人造胚胎”和“基因占卜”也属于这样充满了争议性的技术。我们究竟该如何善用科学与科技的突破进展,回答过去无法被回答的问题,解决过去无法被解决的困难,但却不致于迷失在谁能扮演上帝的迷惑与恐惧中?
同样的状况也出现在谷歌母公司 Alphabet 旗下的Sidewalk Labs的一项计划中,Sidewalk Labs准备在加拿大多伦多启动一项智慧城市试验性项目,通过遍布城市每个角落的传感器,来收集居民活动的所有相关数据。但这到底是大数据用于公众利益的范例,还是个人隐私被侵犯监视噩梦的开始?
幸运的是,并不是所有上榜技术都是让人纠结的双面刃难题。
清洁能源一直都是被高度关注的议题,而在今年我们看到了一个新的机会,一家位于在美国德州中心点的试点工厂,正在积极的发展一项完全乾淨无污染的天然气发电技术,在可预见的未来,无污染的天然气发电将成为最主要的能源供应来源。
从零碳排放的天然气发电、3D 金属打印机、到《银河系漫游指南》书中所写的将巴别鱼塞进耳朵就能听懂不同语言的实时翻译耳塞等等,也都是具有突破性、且将改变世界的重要技术。
▲《银河系漫游指南》中的巴别鱼已经实现?
值得注意的是,可能很多人没有注意到的是,在这次榜单中也包含了由当前火热的区块链所衍生的突破性技术—零知识验证(zero-knowledge proof)的新密码协议,与当前多项由区块链技术发展出的加密货币交易有著紧密关系,要如何在几乎完完全公开交易过程中,仍然维持用户的隐私安全性,这一直都是在区块链与加密货币蓬勃发展背后的隐忧。
该项技术入选十大突破性技术,除了显示区块链在整体经济、乃至于社会体系中扮演的角色将越来越不容忽视,也更进一步凸显于区块链相关技术的讨论,已脱离单纯的加密货币发行与新兴商业模式的初期狂热阶段,进入更强调能够让区块链技术生态环境能够永续发展的关键性技术发展阶段,安全隐私就是其中的重点所在,这攸关于未来区块链技术能否真正成为价值互联网的发展基础,而不只是一时狂热的资金泡沫。
>>延伸阅读
中国新兴科技势力不容忽视,阿里巴巴正在研究其中四项
《麻省理工科技评论》的年度“十大突破性技术”榜单有一个明显的特点,除了列出技术的入选理由、突破点、重大意义、成熟期之外,还会列出全球范围内主导技术研发的“主要研究者”(Key Players)。其中最经典的案例就是2017 年“十大突破性技术”中的“刷脸支付”(Paying With Your Face),这项技术可谓专为中国定制,主要研究者也均为国内一线厂商。
▲ 2017年“十大突破性技术”中的“刷脸支付”可谓专为中国定制
同样,在 2018年“十大突破性技术”榜单中,《麻省理工科技评论》中美编辑部经过深入调研与反复斟酌后,在针对中国发布的榜单内容中,为了避免以偏概全,也加入了来自中国本土的主要研究者,尤其是在人工智能相关领域等。不可否认,中国的科技研发能力已经成为全球最重要的势力之一,在某些领域已经可以与全球顶尖科技公司一决高下。
在2018年“全球十大突破性技术”里,值得关注的是,中国科技巨头阿里巴巴成为给所有人的人工智能(云端AI)、对抗性神经网络、传感城市、材料的量子飞跃四项技术主要研究者。
在入选的四项突破技术中,阿里巴巴是都在做些什么?
传感城市:阿里云ET城市大脑
《麻省理工科技评论》提到多伦多的一个叫Quayside 的项目。他们希望从头开始重新设计一个社区,用最新的数字技术将其重建,会让都市地区变得更加可负担、宜居、环保。
而在中国,阿里云正在和多地政府进行一项更为大胆的尝试——构建城市人工智能中枢ET城市大脑。在杭州,ET城市大脑接管了128个信号灯路口,试点区域通行时间减少15.3%,120救护车到达现场时间缩短一半。
对抗性神经网络:车辆识别与AI设计师
利用对抗性神经网络技术,两个AI 系统可以通过相互对抗来创造超级真实的原创图像或声音,而在此之前,机器从未有这种能力。这给机器带来一种类似想象力的能力,因此可能让它们变得不再那么依赖人类。
在ET城市大脑项目中,阿里巴巴达摩院的科学家使用对抗性神经网络训练ET城市大脑更好的识别客车、火车、卡车的车牌,将识别精准度提高了10%。此外,科学家还将对抗性神经网络用于双11中,完成了数亿张海报的设计。
给所有人的人工智能:阿里云机器学习平台PAI
《麻省理工科技评论》认为,人工智能的应用不应受到少数几家公司统治。其一旦与云技术相结合,那它将可以对许多人变得触手可及,从而实现经济的爆发式增长。在这方面,阿里巴巴已经将很多机器学习工具搬上云端,推动了人工智能革命的到来。
阿里云机器学习平台PAI可以让开发者像做PPT一样开发AI应用。目前提供了回归、分类、聚类、文本分析等100余种算法组件,并支持主流的深度学习框架,包含tensorflow、caffe、MXNET。PAI可以通过托拉拽的方式,实现算法组件的拼接,并提供完整的数据挖掘链路,背靠的阿里云分布式计算引擎可支持百亿特征千亿样本的数据并行化计算。
材料的量子飞跃:阿里云量子计算
在更为前沿的量子研究方面,《麻省理工科技评论》指出,新型量子计算机的研究依然笼罩着一层迷雾,但一个前景无限的应用方向正在向量子计算机招手:精确分子设计。而中国在量子计算方面也有相当明显的成长,正一步步追赶上领先者的脚步。
2017年5月,由中科大、中科院-阿里巴巴量子计算实验、浙江大学共同研制完成的世界首台光量子计算机诞生。另外,同年10 月11 日,由中科院与阿里云合作发佈量子计算云平台,量子计算的商业化已经近在咫尺。同时,世界知名量子计算科学家施尧耘、两次理论计算机最高奖德尔奖得主马里奥·塞格先后加盟阿里云量子实验室。
>>>相关链接
十大突破性技术榜单专家解读
榜单发布后,DeepTech 深科技邀请多位专家参与解读此次公布的十大突破性技术,其中包括 Innovators Under 35 China 首届获奖人丛乐、王旭、韩壁丞、沈亦晨、陈成猛、朱明杰、曾晓东、李林鲜、韦福如等,另外还有多位国内重量级科技企业代表,如商汤-香港中大联合实验室教授李鸿升、达闼科技创始人兼 CEO 黄晓庆、台湾工研院雷射中心副主任洪基彬、阿里巴巴、科大讯飞等,以及 DeepTech 深科技内部专家群,逐一针对十项突破性技术进行深度剖析探究。
以下是该份榜单详细内容及部分解读节选:
实用型 3D 金属打印机
入选理由:新型设备首次让 3D 打印金属零部件成为实用型技术
技术突破:3D 金属打印机实现了低成本快速金属物体打印
重大意义:按需打印大型复杂金属物体的能力将为制造业带来变革
主要研究者:Markforged、Desktop Metal、GE等
成熟期:现在
虽然3D打印技术已经存在了几十年,但它之前仍然局限在业余爱好者和设计师的小圈子内,只是用来制造一次性原型。而且,之前的3D打印技术使用任何非塑料材料(尤其是金属)时,成本非常昂贵,速度也慢得让人无法接受。
不过现在,随着成本越来越低,使用也越来越简单,这项技术有望成为可用于零部件生产的实用技术。如果它被广泛应用,将有可能改变我们大规模量产产品的方式。
短期来看,有了这项技术后,制造商们将不再需要维持大量的库存,他们可以按需地打印一个部件。比如说,当顾客需要给旧车替换一个零部件的时候,就可以立即提供给他。
长期来看,那些大规模生产某一特定零部件的大工厂将会被产品线丰富的小工坊所取代。这些小工坊将能按照顾客的需求随时打印出各种各样的零部件。
这项技术的优势在于它可以生产出更轻、更坚固的金属零部件,以及用传统金属加工方法无法制造出来的复杂形状的零部件。它甚至还可以在制造过程中精确调控金属的微观结构。
2017年,来自劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的研究人员宣布他们研发出了一种3D打印不锈钢零部件的方法,通过这种方法生产出来的零部件的强度是通过传统方法生产出来的两倍。
同样在2017年,位于波士顿附近的3D打印初创公司 Markforged 发布了第一台价格在10万美元以下的3D金属打印机。
而另一家位于波士顿地区的3D打印初创公司Desktop Metal也在2017年12月开始交付他们的第一台 3D 金属原型打印机。该公司还计划推出体积更大的、用于工业制造的打印机,它们的速度将会比之前的 3D 金属打印机快 100 倍。
3D金属打印的操作如今也变得越来越容易。Desktop Metal 公司现在推出了一款用于3D金属打印的软件。使用者只要在软件中输入他们所要打印的物体规格,软件就会生成一个适用于 3D 打印的计算机模型。
GE公司长期以来一直将3D打印技术用于它的航空产品生产中。早在2013年“十大突破性技术”中就曾提到“增材制造”(Additive Manufacturing)。该公司现在也正在测试一款新型3D金属打印机,该打印机打印速度很快,可用于大型零部件的生产。而 GE 计划在 2018 年开始销售该 3D 金属打印机。
专业解读
台湾工研院雷射中心副主任洪基彬:我认为,目前全球该领域的主要玩家还有:德国 EOS、德国 SLM Solutions、葡萄牙 Adira、西安铂力特。
3D 打印在 2012、2013 年受到媒体热烈瞩目,在外界看来后续的发展虽从火热回归平实,但技术的演进并未停止,特别是有机会能改变传统制造业生产方式的 3D 金属打印,潜力更大。
根据美国材料试验学会旗下 F42 技术委员会订定的相关标准,将增材制造,也就是俗称的 3D 打印,分为七大类技术方法,目前应用在“金属”的打印主要有四种技术,分别为金属粉床熔化(PBF,Powder BedFusion)、雷射金属沉积(LMD,Laser Metal Deposition)、黏着剂喷涂成型(Binder Jetting),以及分层实体制造(LOM,Laminated Object Manufacturing)。
在上述的技术中,现阶段最被看好且应用最多的是金属粉床熔化,在列印时披上一层粉末,再透过雷射进行烧熔出想要的形状,两点重要的原因:可以制作出各种复杂形状的产品,以及如果金属粉末控制得宜,就能做出精致度很好的产品。举例来说,25 微米(Micrometer)的金属粉末颗粒就能打印出表面细致度是 25 微米的产品,如果把金属粉末颗粒缩小至 2~5 微米,就可达到表面细致度就是 2~5 微米,就会比传统 CNC 制程做出的更漂亮,但前提是金属粉末必须控制得宜。
目前 3D 金属打印的趋势有三,分别是大尺寸、精致化、自动化。在3D打印最专业的展览、于德国法兰克福举办的Formnext 2017上,GE展出可打印出尺寸可达1米*1米*0.3米的航空零部件,並強調未來可以提高到1米*1米*1米。另外,在自动化部分,GE 也以燃油喷嘴尖端(powerfuel nozzle tip)为例,透过 3D 金属打印,制造工期可由 15~18 个月缩为 3~5 个月,而且此喷射引擎的零件可由 20 件整成 1 件。3D 金属打印也可与机器手臂、工业 4.0 概念结合,提升制造业的自动化程度。
主要积极研究 3D 金属打印的应用行业,包括航太、医材以及顶级跑车,主要是高价、客制化需求高。而未来的发展又是如何?从 Formnext 2017 上业者展出的不少设备都已量产,或是朝量产的方向走去,显示金属 3D 打印的商业运转已经可行,但相较于传统的铸造或锻造工法,3D 金属打印还有几个阻碍,一是机器设备以及金属粉末的成本都仍偏高,二是尽管目前 3D 金属打印已经来到了四支雷射喷头可同时工作,但以用户的角度来看,速度还是慢。
完美的网络隐私
入选理由:原本为加密货币的交易过程开发的一种工具,现在能让你在上网时避免透露任何非必要信息
技术突破:计算机科学家正在完善一款加密工具,可以在不透露非必要信息的前提下完成验证。
重大意义:如果你需要透露个人信息以在网上完成某件事,这个方法可以让你在免除隐私泄漏或身份被盗窃风险的同时轻松实现
主要研究者:Zcash、摩根大通、荷兰国际集团等
成熟期:现在
多亏一款新工具的出现,真正的互联网隐私终于可以实现了。举个例子,该工具可以让你不用透露出生日期就能证明自己年满 18 岁,或者不用透露自己的银行余额或其他细节,就能证明自己在银行有足够的存款可以完成金融交易。这样就大大降低了隐私泄漏或身份盗用的风险。这款工具是一种叫做“零知识验证”(zero-knowledge proof)的新密码协议。
尽管研究人员已经研究了几十年,但直到去年人们对零知识验证的兴趣才开始暴增,某种程度上,这要得益于人们对加密货币日益增长的热情,以及大多数加密货币都为机构所拥有的的现实。同时,很大一定程度上也得益于 2016 年末建立的电子货币——Zcash 把零知识验证应用于实际。Zcash 的研发人员使用一种叫做 zk-SNARK(简明非交互零知识验证)的方法让用户进行匿名交易。通常,这在比特币以及其他公共区块链系统中是不可能实现的,比特币以及其他公共区块链系统中的交易对所有人都是公开透明的。
尽管理论上来说,这些交易都是匿名的,但通过与其他数据进行结合,还是可以追踪到甚至识别出交易人。世界第二大区块链网络以太坊创始人 Vitalik Buterin 将 zk-SNARK 称为一项“彻底改变游戏规则的技术”。对银行来说,这样就可以在支付系统中使用区块链了,同时还能保护客户隐私。
去年,摩根大通将 zk-SNARK 添加到自己基于区块链的支付系统中。不过尽管 zk-SNARK 承诺种种好处,但计算量大,运行缓慢。同时,zk-SNARK 需要“信任安装”,所生成的密钥如果落入坏人之手就可以破坏整个系统。不过,研究人员正在努力研究替代方案,希望可以更加高效地部署零知识验证,同时不需要上述密钥。
专业解读
氪信创始人兼 CEO 朱明杰:如果有一个系统能够在机制公开透明的同时又能够保证用户的隐私得到充分的保证,那么这个系统就会有足够的吸引力,尤其是在区块链中,所有的交易是全网公开的,基于零知识证明的区块链系统就可以以完全公开透明的形式实现信息的隐私保护,这无疑是有着巨大的现实意义的。Zcash 以及 JP Morgan 的区块链系统都基于此实现。
现在,更多的区块链系统将要或正在集成零知识证明这一技术。区块链中有部分成熟的应用,其交易相关的隐私数据需要对任意第三方保密,如在供应链系统中一旦暴露就会造成巨大的后果。对于这类不能将信息暴露给潜在第三方的系统,零知识证明毫无疑问是一个“刚需”。搭上区块链高速发展的快车,零知识证明技术可望在不远的将来得到广泛的应用,成为下一代价值互联网的基石。
达闼科技创始人兼 CEO 黄晓庆:如果认同零知识证明的创新性,这的确是 Zcash 的非常突破的创新,因为它解决了比特币等区块链技术交易完全透明的问题,但在应用方面仍必须要考虑到根密钥的问题,这会是最大的限制所在。事实上,现在也有其他区块链技术如以太坊也开始集成零知识证明功能。
零碳排放天然气发电
入选理由:一种针对天然气发电厂的新工程学方法,将二氧化碳回收再利用
技术突破:一家发电厂能够以廉价高效的方式捕捉天然气燃烧释放的碳元素,避免了温室气体的排放
重大意义:天然气发电为美国提供了近 32% 的电力,其碳排放量也达到电力部门总碳排放量的 30%
主要研究者:8 RiversCapital、Exelon 电力公司、CB&I等
成熟期:3-5年
在可预见的未来,我们可能要一直将天然气作为主要的发电能源之一。现成又便宜的天然气发出的电占美国总发电量的 30%, 全世界发电量的 22%。天然气虽然比煤炭清洁得多,仍造成了大量的碳排放。
在美国炼油工业区的中心休斯顿城外出现了一家前沿发电厂,他们正在测试一项可以实现清洁天然气能源的技术。这家公司拥有 50 兆瓦特的项目,他们就是 Net Power。该公司相信他们能捕获天然气发电过程中释放的所有二氧化碳,同时又能够以低廉的成本发电,至少和标准天然气发电厂的成本相同。
如果此举真的可以实现,就意味着从此就可以以合理的价格从化石燃料中获得零碳能源。这样的天然气发电必会改善能源供给的局面,因为它既不像核能那样成本高企,也不像可再生能源那样供给不稳。
Net Power 公司是 8 Rivers Capital,Exelon 电力公司以及 CB&I 能源公司合作的产物。这家公司的发电厂已经在试运行且开始了初始测试,他们打算在未来几个月内就公布初次评估的结果。
这家发电厂将燃烧天然气产生的二氧化碳放置到高压高温的环境中,并用合成的超临界二氧化碳作为“工质”,驱动一个特制的涡轮机。其中,大部分的二氧化碳都能被不断地再利用,剩下不能利用的可以用一种低成本的方式捕获。
降低成本的关键在于出售部分二氧化碳。目前二氧化碳主要用于协助开采原油。这个市场容量有限,也并不环保。然而最终 Net Power 希望其他行业对二氧化碳的需求能够涨起来,比如水泥制造业、塑料制造业及其他碳基材料行业。
Net Power 的科技并不能解决天然气带来的所有问题,尤其是开采方面的问题,但是只要我们还在使用天然气,就应该让天然气变的更清洁。在正在发展的所有清洁能源技术中 Net Power 的技术是最有远见的技术之一,他向我们展示的是一个真真切切的可减少碳排放的新突破。
专业解读
中国科学院山西煤炭化学研究所副研究员陈成猛:中国目前天然气约占总电力供应量的 3%,截止 2020 年预计将占 6.7%。为使以天然气和煤炭等为燃料的火电厂更清洁环保,在现有技术体系通常是进一步增设 CO2 吸附、脱硫脱硝、降灰等环保装置来实现。
然而,这些手段大都是补救性质的,会增加发电成本和能耗,降低经济效益。Net Power 公司则不然,在天然气发电领域,他们选择了源头创新,彻底摒弃传统的以水蒸气为工质的热能循环过程,选用全新的以高压高温超临界 CO2 为介质的 Allam 循环过程。这样就从本质上解决了 CO2 排放和 NOx 污染的问题,且回收的 CO2 还变废为宝,可应用于采油或作为化工原材料等利用。
该技术发电综合效率更高,设施大幅简化,固定投资少,占地面积小。如果该技术成熟并实现产业化,将引领热力发电领域的技术革命,不仅对天然气发电意义重大,对煤电领域也有非常重要的参考价值。另外,该技术的突破还有望改变当前全球碳排放和碳交易的格局。
该技术的工艺方案独辟蹊径,从热力学原理上是可行的,但估计存在如下工程技术难点:一、由于工质从水蒸气变成了 CO2,对装置的技术要求变化会很大,许多设备都需重新设计开发,其与工艺的匹配性还需进一步的中试和工业示范验证。二、由于燃烧气氛从空气改为纯氧,这就需要在前端增加空气分离装置,会增加一些固定投资和单位能耗。此外,由此带来的燃烧速度控制和安全隐患亦不容小觑。
人造胚胎
入选理由:科学家们已经开始通过干细胞制造胚胎
技术突破:在不使用卵细胞或精子细胞的情况下,研究人员仅从干细胞中就可以培育出类似胚胎的结构,为创造人造生命提供了一条全新的途径
重要意义:人造胚胎将为研究人员研究人类生命神秘起源提供更方便的工具,但该技术正在引发新的生物伦理争议
主要研究者:剑桥大学、密歇根大学、洛克菲勒大学、中国科学院等
成熟期:现在
英国剑桥大学的胚胎学家们在一项重新定义了如何创造人造生命的突破性研究中,利用干细胞培育出了一种逼真的小鼠胚胎。该胚胎并不是由卵细胞与精子结合而来的,只使用了从另一个胚胎中得到的细胞。
研究人员将这些细胞小心翼翼地放在三维支架上观察,细胞随后彼此开始联结,并且排列成几天大的老鼠胚胎独有的子弹形状,研究人员被这一景象吸引住了。“我们知道干细胞有着极其强大的潜能,可以展现出近乎魔法般的能力。然而,我们没有意识到,他们可以如此完美地实现自组织”,团队负责人 Magdelena Zernicka -Goetz 表示。
Zernicka-Goetz 称,她的“合成”的胚胎可能不会发育成老鼠。尽管如此,它们也意味着,我们很快就可以实现在没有卵子的情况下育出哺乳动物。
但这并不是 Zernicka-Goetz 的最终目标。她想研究早期胚胎的细胞是如何开始分化出其特殊作用的。她说,研究的下一步是使用人类胚胎干细胞生成人造胚胎,这也是密歇根大学和洛克菲勒大学正在进行的研究。
人工合成的人类胚胎将是科学家们的福音,这可以让他们梳理出胚胎在早期发展中经历的过程。而且,由于这些胚胎是从易操作的干细胞发展而来的,实验室将能够使用各种工具,例如基因编辑技术,在它们生长的过程中对它们进行研究。
然而,人造胚胎将会引发一些伦理问题。如果它们最终与真实的人类胚胎难以区分,我们该怎么办? 在它们形成痛觉之前,它们能在实验室里成长多久? 生物伦理学家们说,我们需要在科学竞赛愈演愈烈之前解决这些问题。
专业解读:
瑞典卡罗林斯卡医学院助理教授李林鲜:首次在体外培养皿里通过两种干细胞的 3D 共培养模拟了胚胎发育的早期过程,为研究胚胎的早期发育提供了一种可能的替代方法。人造胚胎的研究的价值依然是非常显而易见的,例如应用在胚胎早期发育的基础研究上。在胚胎早期发育的基础研究中,很多时候需要用到如 CRISPR 的基因组编辑工具,比较在培养皿里对干细胞和胚胎的操作难度,干细胞的相关操作要容易些。对干细胞使用 CRISPR 之类的基因组编辑技术比胚胎会更方便。
对抗性神经网络
入选理由:两个 AI 系统通过玩“猫捉老鼠”游戏来获得想象力
技术突破:两个 AI 系统可以通过相互对抗来创造超级真实的原创图像或声音,而在此之前,机器从未有这种能力
重大意义:这给机器带来一种类似想象力的能力,因此可能让它们变得不再那么依赖人类,但也把它们变成了一种能力惊人的数字造假工具
主要研究者:Google Brain、DeepMind、英伟达、中科院自动化所、百度、阿里巴巴、腾讯、商汤科技、依图科技、云从科技、旷视科技等
成熟期:现在
人工智能识别物体的能力已经越来越强了:给它看一百万张图片,它就可以用惊人的准确度来告诉你究竟哪张里面有个行人在过马路。但是 AI 几乎不可能独自生成行人的图片。如果它可以实现这一点,它将可以创造大量看似真实的合成图片,把行人放在各种环境下。而自动驾驶系统或许足不出户就能使用这些图片进行训练。
但问题在于,从无到有创造一个东西需要想象力,而这正是人工智能技术一直难以实现的能力。
直到 2014 年,当时还是蒙特利尔大学博士生的 Ian Goodfellow 在酒吧里与友人进行学术辩论时,他突然想到了这个问题的答案。这种名为“对抗式生成网络”(GAN)的手段会使用两个神经网络(一种简化人脑数学模型,是现代机器学习基石),然后让这两者在数字版的“猫捉老鼠”游戏中相互拼杀。
这两个网络会使用同一个数据集进行训练。其中一个神经网络叫生成网络,它的任务就是依照所见过的图片来生成新的图片,比如一个多长一条手臂的行人。而另外那个神经网络叫判别网络,它的任务则是判断它所见得图片是否与训练时的图片相似,还是由生成模型创造出来的“假货”,比如,判断那个长着三个手臂的人有没有可能是真的?
慢慢的,生成网络创造图片的能力会强到无法被判别网络识破的程度。基本上,经过训练之后,生成网络学会了识别并创造看起来十分真实的行人图片。
这项技术已经成为了在过去十年最具潜力的人工智能突破,帮助机器产生甚至可以欺骗人类的成果。
目前,GAN 已被用于创造听起来十分真实的语音,以及非常逼真的假图片。就拿一个很有名的例子来说,来自芯片公司英伟达的研究人员们用明星照片训练出了一个 GAN 系统,而这个系统则生成了数百张根本不存在、但看起来十分真实的人脸照片。另外一个研究团队则生成了看起来十分逼真的梵高油画。在进一步训练后,GAN 可以对图片进行各种修改,比如在干净的马路上盖上一层雪,或者把马变成斑马。
但是 GAN 的成果并非完美:它们可能生成有两套把手的自行车,或者眉毛错位的脸。但由于有些图片与声音实在太逼真了,一些专家相信,GAN 在某种程度上已经开始理解它们所见到,所听到的世界的底层结构。而这意味着,随着人工智能开始获得想象力,它们也可能开始理解它在这世界上所看到的东西。
Ian Goodfellow发明出GAN后,获得Facebook首席科学家Yann LeCun、NVIDIA创办人黄仁勋、Landing.ai创办人吴恩达等大牛的赞赏,吸引了诸多的机构及企业开始研究。在中国部分,学术机构致力于研究GAN理论的近一步改良及优化,像是中科院自动化所研究人员受人类视觉识别过程启发,提出了双路径GAN(TP-GAN),用于正面人脸图像合成,而商汤-香港中大联合实验室在国际学术大会上发表多项GAN相关研究成果。
中国企业界则是更倾向于把技术应用在服务中,相关案例不胜枚举,比如,百度使用GAN构建语音识别框架,科大讯飞通过GAN与传统深度学习框架的结合在语音合成领域获得了很大的进展。而阿里巴巴的城市大脑项目团队在ACM MM2017会议上,其中发表的一篇论文便是使用GAN来生成用以进行车牌识别的训练数据集。
专业解读:
商汤—香港中文大学联合实验室教授李鸿升:GAN 未来可能对计算机图形学产生冲击,发展三年多的 GAN,在已经发展了 60 年的人工智能领域中,虽然还是很新的技术,不过已经有各种变体或进阶版出现,而且在诸多研究人员及企业的投入下未来仍有许多的可能性。例如有机会从二维的图片进展到三维的视频等等,在更远的将来,有可能会对图形学产生冲击或挑战。
给所有人的人工智能
入选理由:将机器学习工具搬上云端,将有助于人工智能更广泛的传播
技术突破:基于云端的人工智能正在降低这项技术的使用难度和价格
重大意义:目前,人工智能的应用是受到少数几家公司统治的。但其一旦与云技术相结合,那它将可以对许多人变得触手可及,从而实现经济的爆发式增长。
主要研究者包括:亚马逊、谷歌、微软、百度、腾讯、阿里巴巴、科大讯飞、第四范式等
成熟期:现在
人工智能一直以来都只是亚马逊、百度、谷歌和微软等大型科技公司,以及少数初创公司的玩物。对于其他领域的众多公司来说,人工智能太贵也太难,无法全面普及。
这个问题该如何解决?基于云端的机器学习工具正在将人工智能带给更广泛的群体。如今,亚马逊旗下的 AWS 子公司几乎统治了云 AI 市场。谷歌则试图通过 TensorFlow 这款可以开发机器学习系统的开源人工智能框架来挑战它的地位。而谷歌近日刚公开的 Cloud AutoML 也是一套经过预先训练,可以让人工智能变得更容易使用的系统。
以 Azure 平台加入云服务大战的微软则选择与亚马逊合作,推出了一款开源深度学习框架 Gluon。在理论上,Gluon 可以让创建神经网络——一款试图复制人脑学习方式的重要人工智能技术——变得和开发手机 APP 一样简单。
虽然我们不知道究竟哪家公司将会成为人工智能云服务市场的领头羊,但赢家一定会获得巨大的商业机会。
如果人工智能革命会扩散至经济领域的各个角落,那么机器学习工具也将会随之成为必需品。
如今的人工智能技术绝大多数仅用于科技行业,为这个领域带来了效率的提升以及多种新的产品和服务。但是其他的公司与行业一直难以利用人工智能技术的发展。如果可以在医疗、制造以及能源等行业里更全面地推行人工智能技术,将极大提高各产业的生产力。
可惜,绝大多数的公司依然缺乏了解如何使用云端人工智能的人才。所以,亚马逊与谷歌也创办了咨询服务。当这项技术通过云端来到每个人的面前的时候,真正的人工智能革命才会开始。
专业解读:
Lightelligence 联合创始人兼 CEO 沈亦晨:计算硬件是人工智能的核心之一,算力更高的计算硬件可以在更短的时间里完成神经网络的训练,而由于 AI 处理器(如 NVIDIA 的 GPU)更新换代很快,售价高,更换硬件也比较麻烦,个人用户每年更换处理器并不经济,而云计算平台把有限的资源集约化共享给大众。AI 算法共享也是云平台的一大优势,目前有一些已经被广泛使用的 AI 算法,如人脸识别,语音识别,图像识别等,都是定义非常清晰的,公众也只需要一个结果最好的算法。
基因占卜
入选理由:大规模基因研究将让科学家能够预测普通疾病及人格特征
技术突破:科学家们现在可以利用你的基因组数据预测你患心脏病或乳腺癌的几率,甚至你的智商也能被预测
重大意义:基于 DNA 的预测技术可能公共健康领域下一个重大突破,但它将增加歧视的风险
主要研究者:Helix、23andMe、Myriad Genetics、UKBiobank 、Broad Institute、华大基因、奕真生物、WeGene等
成熟期:现在
将来有一天,婴儿出生时就会得到一份 DNA 检测报告。这些报告将提供婴儿患心脏病或癌症的几率、是否对烟草上瘾,以及是否比一般人更聪明的预测。由于大型基因研究(部分研究涉及人数超过 100 万人)的开展以及科学进步,这样的报告很快就会从概念变成现实。
事实证明,最常见的疾病和人们的许多行为和特征,包括智力水平,都不是一个或几个基因影响的结果,而是许多基因作用的结果。利用正在进行的大型基因研究的数据,科学家们正在创造他们所谓的“多基因风险评分”指标。
尽管新的 DNA 测试只是提供了概率推断,而不是直接得出诊断结论,但依然可以极大地造福医学的发展。例如,如果那些患乳腺癌几率高的女性做更多的乳房 X 光检查,而患病几率低的女性做更少的乳房 X 光检查,那么这些检查可能会发现更多真正罹患癌症的患者,也能降低假警报发生的几率。制药公司还可以在针对阿尔茨海默病或心脏病等疾病的预防性药物的临床试验中使用这些分数指标。通过挑选患病风险更高的志愿者,他们可以更准确地测试药物的效果。
问题是,这些预测远非完美。谁愿意知道他们未来可能会患上阿兹海默症? 如果癌症风险指标得分低的人推迟接受筛查,然后又患上癌症怎么办? 多基因检查指标评分也存在其他争议,因为它们几乎可以预测任何个体特征,不仅仅是疾病。例如,我们现在可能只能预测一个人在智商测试中表现的 10%。随着评分技术的提升,基于 DNA 的智商预测很可能会成为常态。
然而,家长和教育工作者应该如何使用这些信息呢? 对此,行为遗传学家 EricTurkheimer 表示,这项新技术“既令人兴奋又令人担忧”,因为基因数据不仅可以造福我们,也有可能会被用于其他用途,产生不好的影响。
专业解读
麻省理工学院-哈佛大学布罗德研究所研究员、清华大学访问学者丛乐:基因组学的科研进展结合大规模临床研究,使科学家看到基因预测未来的曙光。
这一领域近年来加速式前进,并获得来自大学院校等科研机构,初创公司跨国药厂等企业,以及风险投资等资本市场的持续投入,从而让研究人员得以分析预判遗传信息对人类的健康状况、疾病风险、甚至智力等个人能力等影响,这无疑将会影响医疗、保险、教育等多个层面,而这一连串的效应虽然刚刚开始但发展迅猛,究竟是福是祸尚未可知。
基因信息具有很强的个性化差异与地区性差异,所以,针对一个地区一类人群的研究与技术结果不一定适用于全球其他个体(比如亚洲人vs.欧美人),这无疑会带来更多挑战,但也意味着有更多的机会。遗传信息有静态的部分,比如每个人的细胞最开始都来源于精子卵子结合后形成的胚胎细胞,也有动态部分,比如发育过程中的基因突变可能导致遗传病,或者衰老过程中的基因突变可能导致癌症和老年病,并不是一生只做一次检查就足够,也不是做的越多就代表越好越准确,仍需要许多基础和临床研究开发相关技术与数据分析工具。
除了经典的DNA基因组信息,还有很多疾病是由基因组的修饰和RNA表达变化等因素导致,我们称之为表冠遗传学。整体来看,儘管基因预测技术的发展受到高度瞩目,但就实际的发展历程来看,目前我们还只看到人类基因信息的冰山一角而已。
传感城市
入选理由:Alphabet 旗下的 Sidewalk Labs 计划创建一个高科技社区来重新思考到底应该如何建设和运营一座城市
技术突破:多伦多的一个街区有望成为全球首个成功将尖端城市设计与前沿科技融合在一起的地方
重大意义:智慧城市会让都市地区变得更加可负担、宜居、环保
主要研究者:Alphabet 旗下的 Sidewalk Labs、多伦多 Waterfront、阿里巴巴等
成熟期:项目 2017 年 10 月对外公布,预计在 2019 年开始施工建设
如今,全球很多智慧城市计划都已搁浅,要么下调了曾经雄心勃勃的目标,要么因为生活成本原因逼走了超级富豪之外的普通居民。而多伦多的一个叫 Quayside 的项目,却希望从头开始重新设计一个社区,用最新的数字技术将其重建,打破现有的失败局面。
Alphabet 旗下位于纽约市的 Sidewalk Labs 将和加拿大政府进行合作,让这一高科技项目落地在多伦多 Waterfront 工业区。
该项目的目标之一就是让一切关于设计、政策以及信息科技的决策都以一个巨大的传感器网络为基础。这个网络将收集各种信息:空气质量、噪声水平以及人们的行为等数据。
在该规划中,一切车辆都是自动驾驶的共享车辆,地下也将跑着负责送快递这种低级体力劳动的机器人。Sidewalk Labs 表示,他们计划让正在设计的软件与系统开源,可以允许其他公司在其上创建服务,类似为手机开发 APP 的做法。
该公司计划密切监视公共基础设施,然而这却引起了对数据管理与隐私的担忧。但是 Sidewalk Labs 相信,它可以通过与社区和当地政府的合作,缓解部分担忧。
“在 Quayside 项目中,我们所做的最独特的一点就是,这个项目不仅包含我们巨大的野心,也有着一定程度上的谦逊”,负责城市系统规划的 Sidewalk Labs 高管 RitAggarwala 说道。而这种谦逊有望帮助 Quayside 避开之前那些智慧城市计划时常遭遇的各种问题。
目前,北美已有多个城市正在争取成为 Sidewalk Labs 的下一个标的。据管理 Quayside 开发的某公共部门 CEO WillFleissig 表示:“旧金山、丹佛、洛杉矶以及波士顿都来联系我们,就是为了获得引荐。”
专业解读
蚂蚁技术实验室无人值守算法技术负责人曾晓东:城市版本的“操作系统 OS”,搭载先进的“四肢”与“感官系统”为项目的关键所在。毫无疑问,物联网技术在项目中会得到广泛的应用,大量的传感器将融入整个城市的建设当中,就如同给城市装上全新的数字肢体和感官,万物实现互联、可感、可控,城市的运行将由一个无比强大的 AI 接管。
城市版本的“Android”有机会成为可能,项目中搭建的城市平台打通物质空间层面与科技数据层面,透过标准层面输出基础工具与功能,这点与智能手机的操作系统类似。那如果与其和智能手机的生态进行类比,基于这个超级城市版本的“OS”,能否引入更多的“城市开发者”来搭建上层的“城市APP”,这点很值得期待。
中国科学院生态环境研究中心副研究员王旭:到 2050 年,全球 70% 的人口将居住在城市,而且随着城市化快速扩张,传统基础设施存在的问题和产生的社会、经济和环境压力将与之俱增。相比传统基础设施的发展和存在模式,基于传感器建设的未来城市基础设施新范式,将会以更加集成、更加智能的方法来建设和管理基础设施,而不是将城市的能源、交通和水务等基础设施单元或环节单独割裂管理。
但当前这种基础设施新范式,研究和应用热点更多关注城市交通和能源系统,对于城市其他的重要基础设施系统,例如水与环境卫生等的投入相对较少,另外,对城市基础设施不同单元环节的耦合性、抗干扰性、弹性和可持续性方面的研究关注度仍有待提高。
巴别鱼耳塞
入选理由:虽然现有硬件并不那么好用,但谷歌 Pixel Buds 却展示了实时翻译的前景
技术突破:近实时翻译适用于多种语言,而且使用起来很方便
重大意义:在全球化日益发展的今天,语言仍是交流的一大障碍
主要研究者:谷歌、科大讯飞、百度、腾讯、搜狗、清华大学、哈尔滨工业大学、苏州大学等
成熟期:现在
在风靡一时的科幻经典《银河系漫游指南》中,你把一条黄色的巴别鱼塞到耳朵里,就可以听到实时翻译。在现实世界中,谷歌已经研究出了一个过渡性的解决方案:一副叫做 Pixel Buds 价值 159 美元的耳塞。这副耳塞可以在 Pixel 智能手机上通过谷歌翻译应用进行实时翻译。需要一个人佩戴耳塞,另一个人手持手机。
佩戴耳塞的人用自己的语言讲话——默认是英语——然后谷歌翻译应用就会对所讲的话进行翻译,并在智能手机上大声播放。手持手机的人回应后,回答被翻译,然后在耳塞中播放。
谷歌翻译之前就已经有了对话功能,其 iOS 和安卓版应用都可以自动识别说话者的语言,然后自动翻译。但背景噪音会增加应用理解话语的难度,同时也会让应用很难判断说话人何时停顿,何时开始翻译。Pixel Buds 有效解决了这些问题,因为佩戴人可以在说话的同时用手指点击和长按右边的耳塞。将交互分别放在智能手机和耳塞上,可以让双方都能控制麦克风,帮助讲者保持眼神交流,因为这样就不用来回传递手机了。
目前,Pixel Buds 因为低于行业平均水准的设计而备受抨击。耳塞看起来很不智能,也不是很贴合耳朵,而且很难与手机进行适配。不过硬件笨拙还是有计可施的。Pixel Buds 让大家看到了近实时翻译跨语言障碍自由沟通的曙光,而且你还不用把一条巴别鱼塞到耳朵里。
在中国,有许多公司也积极投入发展,科大讯飞、百度、搜狗可以说是这个领域的领先者,除了提供智能语音、翻译等服务外,也将技术引入硬件中,不过,相较于外国业者偏好以耳机作为切入点,中国企业则选择翻译机,像是科大讯飞推出晓译翻译机,百度则有共享 WiFi 翻译机,搜狗也在日前发表“旅行翻译宝”和“速记翻译笔”。
专业解读
微软亚洲研究院资深研究员/研究经理韦福如:基于序列到序列(sequenceto sequence)的端对端神经网络机器翻译(NMT,Neural Machine Translation)近年来大幅度提高了机器翻译的质量和水平,是深度学习算法在自然语言处理领域最大的突破和成果之一,NMT 技术的进步也进一步触发相关服务和硬件的创新。
BrainCo 及 BrainRobotics 创始人兼 CEO 韩璧丞:Google 发布的这款 pixel buds 是其对于智能耳机领域的第一次的尝试,然而小硬件背后却是大心思。仅通过这一款硬件,Google就攒起自家过半的当家AI技术-知识图谱、自然语音处理、翻译、语音识别,以家居+车载+便携的全场景语音接口,撬动智能家居,智能出行等生态系统,这次打造耳机便携 AI 接口的野心不可谓不大。
材料的量子飞跃
入选理由:研究者们最近开始使用量子计算机对简单分子进行建模,而这仅仅是开始
技术突破:IBM 采用7量子比特的量子计算机对小分子的电子结构成功地进行彷真计算
重大意义:借助该技术,科学家能了解分子的各个方面信息并以此开发出更有效的药物以及更高效生成或传输能源的新材料
主要研究者:IBM、Google、哈佛大学 Alán Aspuru-Guzik 教授、中国科技大学、中国科学院、浙江大学、阿里巴巴等
成熟期:5到10年
新型量子计算机功能强大,不过它的发展道路上依然笼罩着一层迷雾:量子计算机有着当今计算机无法比拟的计算力,但是我们至今尚未弄清楚这种能力能被用来做什么。一个前景无限的应用方向正在向量子计算机招手:精确分子设计。
多少年来,化学家都梦想着能设计出新型蛋白质,用于研制更有疗效的药物,或是设计出新型高效电池中的电解质、直接将太阳能转化为液态燃料的神奇化合物以及更高效的太阳能电池。然而,这些技术中的材料分子都难以在计算机上建模和彷真,遑论设计和合成了。即使彷真一个简单分子的电子形态这样的任务,都会复杂到让现有的计算机败下阵来。不过,这对于量子计算机而言就是小菜一碟了。
相比传统计算机那样采用“1”或“0”的数字比特(Digital Bits)作为计算和存储单元,量子计算机采用量子系统的量子比特(Qubits)作为运算单元。最近,IBM 的研究者应用7量子比特量子计算机针对一个三原子分子进行了彷真实验。
如今,科学家正在打造具有更多量子比特的量子计算机,量子算法也在提升,我们更感兴趣的大分子精确彷真计算也将成为可能。
实际上,中国在量子计算方面也有相当明显的成长,虽然目前的技术层次还无法与前面几家大企业相提并论,但是在产业、学术界,以及政府的通力合作之下,也正一步步追赶上领先者的脚步。
2017年5月,中国科学院宣布由中科大、中国科学院──阿里巴巴量子核算实验室、浙江大学、中科院物理所等单位或公司联合研製的光量子电脑正式诞生。另外,同年10月11日,由中科院与阿里云合作发佈量子计算云平台,量子计算的商业化已经近在咫尺,速度毫不逊色于欧美的脚步。
然而,量子计算还有不少需要突破的地方,首先,量子计算的精度相当低,虽然用在深度学习等精度需求不高的计算上相当合适,但要处理传统计算机的通用计算工作,可能就力有未逮了。其次,量子计算这种高度并行的计算环境需要框架的适配,以及编译器的针对性优化,这种开发逻辑与现有的计算架构完全不同。
责任编辑:顾军
综合自DeepTech深科技、凤凰网等。