在今天的浦江创新论坛未来分论坛上,年轻物理学家们关心起了社会问题:为什么一个谣言能在社交网络上疯狂传播?为什么局部地区的电力故障最终会引发大范围断电?这些看似无规律可循的事件,物理学家们正尝试用算法和模型找到其后的扩散机制。
这就是眼下的一种新交叉学科——复杂网络研究。所谓复杂网络研究,指的是研究那些由诸多个个体所构成的整体网络和这些个体之间的关系,比如某个输电站和电网、人脑神经元和整个神经系统等等。
“通过对此类复杂网络的研究,我们试图找到个体和整体之间的关联,进而对整体系统进行精准量化和预测。” 纽约市立学院物理学教授海纳·马克思(Hernan Makse)说,也许有一天,预防停电、疏导城市交通和控制流行病传播都会变得非常简单。
大数据使得对于复杂事件的预判和分析成为可能
这一切是如何实现的?
法国国家健康与医学研究院EPlcx实验室研究主任维多利亚·科里扎(Vittoria Colizza)用一张地图向我们讲述了这样一个故事:为了研究亨尼帕病毒的传播路径,她和她的团队曾对两万人进行调查,这些人群覆盖了6000个机场中80%的航班。人群加上航空流动数据再加上流行病数据,层层叠加之后就形成一张该病毒的全球传播图谱。
一旦运用大数据,原本复杂的病毒传播过程就像是在眼皮底下发生的似的。“以往一旦爆发传染性疾病,政府通常的做法是加强航空管制、禁止出入境,不过我们从传播图谱上却看到,这种管控不但无法把疾病挡在国门外,甚至还阻碍了救助医生和药品的跨国运输。”维多利亚说。
越来越多的科学家们相信,运用数据不但可以提高人们对复杂传播系统的理解,反过来这种理解也会进一步促进人们对大数据背后规律的把握。
预测只是预测,并不能保证百分百精准
一方面科学家们希望能有更多的数据来支撑他们的模型,另一方面过多的数据却会增加研究的不确定性。海纳曾通过对美国各大社交网络上大选信息进行大数据分析来预测大选结果,最终预测失败。“数据把我们淹没了。”海纳坦言。有时候过多的数据意味着过多的干扰因素,这对追求简单公式和模型的科学家来说是一件痛苦的事。“我们要对大数据进行筛选,减少这些干扰因素。”海纳说。
同时,在研究人类的复杂行为时,数据分析与隐私保护又是摆在科学家面前的一道两难题。“其实科学家要获取数据有非常多的方法。”丹麦科技大学应用数学与计算机科学副教授莱曼(Sune Lehmann)说,比如,从一个Wi-Fi信号就可以分析出某人的活动区域,甚至是他的社交网络,但这些信息是可以被使用的吗?如何保证基于这些信息的研究结果不过被商业滥用呢?
“这是一个跨越数学、物理、生物学、计算机科学、社会学和工程学的交叉学科。”莱曼说,不仅需要科学家的合作,也需要法律和政策的介入。
要让科学家的研究成果真正解决社会问题恐怕还不容易
由于复杂网络研究还刚刚起步,基于它的预测结果还比较模糊,在从高校研究走向社会应用的路上,这一研究可碰了不少“鼻子灰”。维多利亚记得当年SARS病毒流行时,她把一份SARS病毒传播报告放在了有关部门的办公桌上,却没有得到重视。“当我们说尼斯的流行病传播现状时,法国人民关心的却只是巴黎。”维多利亚说,如何与政府决策部门合作、沟通,她也走了很多弯路。
相对而言,我国在这方面的研究与应用结合得更为紧密。“我们的研究结果已经在阿里巴巴集团运用,帮助它们预测并预防网络购物欺诈、刷单等行为。”电子科学大学基础与前沿研究院教授吕琳媛说,中国移动、腾讯等企业也都已经是她的合作方。值得一提的是,她也是阿里巴巴复杂科学研究中心的主任。“运用一些网络识别方法,我相信我们可以找到复杂、无规律行为背后的普适性规律,帮助社会更加美好。”吕琳媛说。
作者:金婉霞
编辑:郝梦夷
责任编辑:唐闻佳
*文汇独家稿件,转载请注明出处。