利用人工智能诊治疾病是人类一个雄心勃勃的计划,而且早就有一些初步结果。如美国国际商业机器公司(IBM)2007年推出的人工智能软件——沃森医生。去年1月,时任美国总统奥巴马宣布的“癌症登月计划”,其中一个项目就是让人工智能进行深度学习,以识别癌症。
在癌症诊治领域,人工智能的学习任务有三:通过深度学习在分子层面认识癌症;进行药物筛查;通过大数据分析,提供最佳治疗策略。
现在,具备深度学习功能的机器人医生不但已经进入实践,而且取得了可喜的进展。
人工智能如何诊治癌症
要让人工智能诊治癌症,首先需要人工智能有像人一样感知周围环境的能力,尤其是能感知人的机体状态——什么是正常的机体,什么是异常的机体,甚至是癌变的机体,尤其是只具有微小变化的机体,例如,只有几个细胞发生癌变的极为微小生物环境。
第二步是,人工智能不仅要感知正常和异常机体的不同,还要理解为何有这样的不同,是癌变引起的不同,还是其他疾病引起的不同。最后第三步才是判断和决策,即得出结论,在感知和正确理解的基础上,向医生提供对某个个体检测的结果,是患癌还是没有患癌,抑或是患了其他疾病。
机器学习(算法)是人工智能的一个基本内容,其中,数据的输入、输出、赋值等运算,可以让人工智能对某一问题进行计算分析,从而得出初步结果。这也可以用来对癌症进行诊断和治疗。
加拿大安大略省西方大学的罗根等人研发了一套算法,通过对基因数据的分析得出最可能的有效治疗癌症的方案,并且让该治疗方案变得更加个性化。
研究人员使用了一套含有40个基因的数据,这些基因可以在90%的乳腺癌中找到。在接受试验的近350名癌症病人中,至少都会接受一种化疗药物如紫杉醇或吉西他滨的治疗。之后,研究人员让人工智能对数据展开处理,并找出药物与病人基因之间存在的关系。结果显示,同时接受两种药物治疗的有效率为84%,只接受紫杉醇的为82%,只接受吉西他滨的则在62%-71%之间。
这就为医生提供了选择更好或最佳治疗方案的决策基础,例如,在上述方案中,医生选择对病人同时使用紫杉醇和吉西他滨,可以达到最高的84%的治疗有效率。
2016年,日本研究人员称,他们开发的人工智能软件能够准确诊断出女性患者所患的罕见类型的白血病,而且,这种软件对肿瘤大数据的提取和分析是其优势之一,它仅需要花费10分钟时间,就能够对来自2000万个临床肿瘤研究所提供的女性遗传信息进行对比分析,从而做出诊断。
但是,最早开发人应用于医疗领域的人工智能的美国国际商业机器公司 (IBM) 更是走在了前面 (见相关链接——从“沃森医生”到“沃森基因组”)。
深度学习的三大任务
2016年1月,美国总统奥巴马宣布了“癌症登月计划”,其中一个项目就是让人工智能进行深度学习,以识别癌症。
在癌症诊治领域,人工智能通过深度学习,要完成三项任务——
首先是从认识癌症的分子层面学习,让人工智能了解蛋白质相互作用的机理。
其次是进行临床前的药物筛查。这是一种研发癌症药物的预测模型,在临床试验前进行最大化地药物筛选,为癌症病人提供精准医疗方案。具体而言,是对临床前和临床试验时的癌症数据进行筛选,结合小鼠模型中的新数据,通过反馈循环让实验模型指导计算模型设计,建立肿瘤药物反应的预测模型。其实,这也是基于特殊数据的学习和分析。
第三是建立人口模型。这就要求人工智能根据不同人群的生活方式、生活环境、所患癌症的种类、不同的医疗体系等,从数百万癌症病人的病历数据中自动分析,从而获取最佳治疗策略。当然,海量病人的数据来自美国国家卫生研究院、美国食品和药品管理局、制药公司和第三方付款机构。
可以看到,美国的“癌症登月计划”中的人工智能深度学习并不包含肿瘤图像的识别,所以人工智能诊治癌症的深度学习在不同的国家有不同的内容。
快速精确解读肿瘤图像
诊断癌症不仅要靠解读癌症特有的基因、分子标记物等,还要认识和判断用各种物理和化学方式拍摄的人体肿瘤图像,这既是人工智能深度学习的内容,又是人工智能帮助人类诊治癌症的一个重要途径,在这个方面,人工智能也已取得了一些进展。
2016年8月,美国休斯顿卫理公会医院的研究人员在《癌症》杂志上发表文章称,他们开发的一款人工智能软件在解析乳腺X光图片时,比普通医生快30倍,其准确率更是高达99%。这个癌症诊断软件可以直观地将X光图片的信息转译成诊断信息,方便医生快速对病人病情作出判断,避免耽误病情。
即便是肿瘤科的专科医生,对X光片、CT和核磁共振成像图片的解读都不会是百分之百的准确。美国疾控中心和癌症协会的数据显示,每年美国大约有1210万人接受乳腺X光片监测,但其中差不多有一半在X光片上都有阳性结果,但实际上是假阳性。为此,又迫使大量女性为了求得安心而进一步接受乳腺活组织检查,进行这一检查的人每年有160万人左右,其中20%的女性根本就没病。这给许多女性及其家庭造成了极大经济和精神负担。
为了改变这种状况,研究人员打算从人工智能着手,来解决X光片识别癌症的假阳性问题。卫理公会医院的研究人员设计的这个人工智能软件,不但能扫描病人的X光影像结果、采集诊断特征,并将乳腺X线影像结果与乳腺癌亚型进行关联。此后,医生可使用软件的分析结果来精确预测每个病人是否有罹患乳腺癌的风险。
利用这个人工智能软件,研究人员解读了500名乳腺癌病人的乳腺 X线影像结果和病理组织切片报告,同时还安排了各种相关医学数据,试图迷惑人工智能软件。另一方面,让两名肿瘤科的权威医生进行同样的读片诊断。人工智能用了几个小时就完成了对诊断,但两位乳腺癌专业的权威医生却花了50-70小时。
这套软件能够快速和准确诊断乳腺癌的原因也在于,它能在很短时间内回顾几百万份记录,通过解读病人的乳腺X线影像结果来帮助医生诊断,效率更高。如此,也有望减少不必要的组织活检。
目前,乳腺癌组织活检结果的准确率只有60%-80%,美国每年浪费在最简单的非侵入性乳腺癌上的资金也高达3500万美元。
预计到2024年,美国乳腺癌活检设备的市场规模将达9.11亿美元。
相关链接
从“沃森医生”到“沃森基因组”
美国IBM公司之前推出的人工智能软件——沃森医生,是一个建立在对大数据的检索、使用和算法之上的疾病诊治系统。沃森医生储存了数百万的文档资料,包括字典、百科全书、新闻报道、文学作品及其他可以建立知识库的参考材料。沃森医生的硬件配置可以使它每秒处理500GB的数据,相当于1秒阅读100万本书。
沃森医生在面临一位就诊者的时候,会进行一系列的算法,包括语法语义分析、对各个知识库进行搜索、提取备选答案、对备选答案证据的搜寻、对证据强度的计算和综合等。此外,沃森医生还可以通过询问病人的病征、病史,迅速给出诊断提示和治疗意见。通过这些程序进行诊断,沃森医生的诊断准确率达到73%。
现在经过多年的改进,沃森医生在对癌症的识别和诊断方面有了突破。最近,IBM和美国著名的Illumina基因公司进行合作,在沃森医生的基础上,专门进行癌症基因组的标准化测序和解读,用以诊断癌症。根据这个目标,IBM研发了一个新的专门对基因组进行测序和分析的软件,即沃森基因组 (相当于专门诊治肿瘤的专科医生),并将这个软件整合到Illumina公司的肿瘤测序计划中,这就可以让沃森基因组能够使用 Illumina公司的实体肿瘤分析面板。
新的智能软件融合后,沃森基因组可以在短短几分钟内,读取实体肿瘤分析面板生成的遗传信息文件,梳理专业指南、医学文献、临床试验汇编和其他知识来源。然后,系统将生成包含每个基因组改变的注释报告。使用沃森基因组可以大幅减少解释结果所花费的时间。
比较起来,研究人员也可以使用实体肿瘤分析面板进行癌症基因的检测,但是速度很慢。沃森基因组在几分钟内做的事情,研究人员一般需要一个多星期来做。
不仅在速度上沃森基因组可以比人类快得多,而且在检测的准确性以及提供治疗癌症的方式上,沃森基因组与临床大夫和肿瘤专家提供的方案基本一致。美国北卡罗来纳大学教堂山分校的夏普尼斯博士研究了1000余名癌症患者的数据,发现在99%的病例中,沃森基因组提出的治疗建议与分子肿瘤专家团提出的治疗建议相同。此外,在30%的肿瘤病例中,沃森基因组还发现了癌症专家遗漏的一些细节。
基于这些结果,研究人员认为,教会人工智能诊治肿瘤大有可为。现在,美国20个专注于基因组学和肿瘤学领域的癌症研究所,包括纪念斯隆-凯特林癌症中心和北卡罗来纳大学教堂山分校的肿瘤研究机构,正在进一步培训沃森基因组,以便更快更好地诊治癌症。(田地)
人工智能、机器学习、深度学习之间的区别
去年上半年,谷歌研发的阿尔法狗打败了韩国围棋大师李世石。在这之后,媒体纷纷采用人工智能、机器学习、深度学习这三个词语,来解释阿尔法狗获胜的原因,但它们到底有什么区别呢?
这三者的关系可以看成是一个同心圆。最外层最大的圆是人工智能,是一个最广泛的概念;中间的圆是机器学习;而核心圆是驱动人工智能发展的深度学习。
1956年,达特茅斯会议正式提出了人工智能(AI)的概念。在这之后,很多计算机科学家开展了研究,AI变成了我们的幻想。
自2015年起,AI得到了迅速发展。其中最主要的原因是图形处理器(GPU) 的普及,使得平行处理更快、更便宜、更高效。还有一个原因,是随着GPU实际存储容量无限放大,开启了大数据时代。
机器学习有很多算法策略,包括决策树学习、归纳逻辑程序设计、聚类分析、强化学习和贝叶斯网络等。但这些算法并没有形成最终强人工智能的目标,因为运用早期的机器学习技术,就连弱人工智能都无法达到。
近年来,机器学习最好的一个运用就是计算机视觉,但这项应用的开发仍需大量人工手写代码。
托深度学习的福,机器学习中很多应用可变为现实。今天,机器的图像识别技术在某些方面已做得比人类还好,如对血液中癌症特征的识别,以及在磁共振成像中对肿瘤的识别。
深度学习将拓宽人工智能的领域,无人驾驶车、更好的预防性治疗,将很快出现在公众的生活之中。(小珍)