AI x医疗是个伪命题吗?(中恒星光产业洞见系列28)

摘要: 人工智能在近来是最炙手可热的话题,特别是医疗领域,已经成为人工智能现在最火的应用场景之一,科技巨头、创业公司纷纷进驻,相关的新闻铺天盖地袭来。那么医疗领域是否真的需要人工智能?当前的应用场景、难点、困境又是哪些呢?

点击上方关注【中恒星光金融控股】


人工智能在近来是最炙手可热的话题,特别是医疗领域,已经成为人工智能现在最火的应用场景之一,科技巨头、创业公司纷纷进驻,相关的新闻铺天盖地袭来。那么医疗领域是否真的需要人工智能?当前的应用场景、难点、困境又是哪些呢?


医疗需要人工智能吗?

        就如同前几年的“大数据”一样,人工智能似乎已经成为当今公司用于标榜、宣传自身技术先进性的“万金油”标语,但从当前人工智能的发展进度来说,人工智能起码在短期内仅适用于部分场景,特别是那些存在流程繁琐复杂、依靠人力重复劳作、数据量过大、有一定规律可循、需要大量经验积累、动态发展人力难以预测等问题的领域最适合人工智能的发展,而医疗领域恰恰存在这些问题。


        我国存在非常严重的医疗资源供给不足的问题。我国病患数量规模庞大,而医生数量严重不足,并且分布非常的不平衡,优质的医疗资源都集中在发达地区,在基层医疗机构有非常严重的医疗资源缺口。特别是在医生资源方面,举个简单例子,我国单病理科人才的缺口就达近10万(现有2万),更不用说其中有经验的资深医生缺口了。并且,由于对医生能力的过度依赖,造成不同地区间、基层医院与三级医院间的医疗水平差距巨大。目前国家正在主推的分级诊疗,目的就是缓解医疗资源供需不均的问题,将80%的普通疾病和筛查放在基层医院,而将20%的疑难杂症放在三级医院交由专家检查,但在执行上受到了基层医生数量少、水平不足等问题制约,推动十分缓慢。


        而在资源供给不足的前提下,又存在着对医生资源的浪费现象,进一步加剧供需不均的问题。现代医学虽然经过长久的积累和发展已经取得了相当大的成就,但在临床治疗上,许多领域仍然没有坚实的理论支撑和量化的诊疗标准,导致临床治疗对医生的依赖性太大,需要依靠医生的经验等来弥补理论的缺失。因此医生需要深度介入到病人从前期诊断到后期治疗过程中的所有环节,以保证实施有效、正确的治疗方案。在这其中,医生需要做大量的重复性劳动,例如影像、病理诊断,都需要以人力去完成对大量数据的筛查、分析,这些机械性劳动实际都有一定的规律可循,是最适合由机器完成的,用宝贵的医生资源去完成这些任务对医疗资源是非常大的浪费。

  

        如果机器能够在一定程度上代替人工,解放医生精力的同时,又能提供在平均水平之上的诊断、治疗解决方案,那么必然会对解决当前医疗问题起到关键性的作用,这就是人工智能在医疗领域未来的发展方向。


影像是人工智能最先落地的应用?

        在医疗领域,智能图像识别主要包括医学影像和病理学图像两类,由于市场规模够大,其痛点也最明显,加上基础理论研究蓬勃发展,因此成为最常见的人工智能应用领域之一。


        在医学影像中,由于病灶往往形态各异,经常出现同病异影(同一病变可有不同的影像表现)、异病同影(不同的病变有相似的征象)现象,缺乏诊断的量化指标,导致医疗影像的解读需要长时间专业经验的积累,医师间的水平差距过大。资深影像医师的稀缺,因此基层医疗机构难以满足患者需求。此外,医学影像包含了海量的数据,真正的病灶可能仅仅占全图像的千分之一,即使是资深医生也往往无从下手,需要花费大量功夫看片、解读,并且可能有八成的病患都是健康的,但同样要花费大量时间诊断。放射科医生在诊断常规的CT扫描图像需要10-20分钟,并且需要花费10分钟来进行撰写诊断报告,时间过长。并且在这种情况下,解读的结果往往不尽如人意,根据WHO调查,我国每年影像误诊人数高达5700多万,误诊现象主要发生在基层医疗机构。


        病理诊断也面临着医学影像同样的问题。病理科医师数量稀缺程度远比影像医师来得严重,一名资深病理科医师可能需要长达15年的培训和经验积累。医生缺失导致我国超过半数以上的二级医院没有病理科,而半数以上设有病理科的三级医院则缺乏诊断能力,只能将诊断任务转诊。医师在对图像的解读上的难度比医学影像有过之而无不及,一张病理切片10万像素x10万像素以上,医师需要在这其中筛选出热点区域,再在热点区域中观察可能1个像素大小都不到的细胞的微弱区别,再进行解读诊断。判断的高难度造成病理诊断的误诊率同样居高不下,基本上误诊率都在5成左右。

   

        对于人工智能来说,其能通过对海量的图像数据进行学习,加快了经验累积的过程,并且从海量数据中识别出细微的病灶或捕捉变异细胞等也是人工智能所擅长的,最终人工智能能提供在平均水平甚至是超过资深医师水平之上的诊断结果,为医师诊断提出建议。根据美国知名人工智能医学影像公司Enlitic数据显示,其对于肺癌检出精度比人工检测精度高出5成以上,并且将诊断的时间缩短至5分钟左右。当然,在短期内人工智能尚不足以取代影像医师,但能在相当大的程度上提升全行业的诊断水平,缩短诊断时间,解决资源供给不足、效率低下的问题。

   

        从产品落地层面上看,检测结果必须先实现数字化,才能够通过人工智能进行诊断。而图像领域有比较强的先天优势,数字化的图像系统已发展多年,虽然在我国仍有相当大部分的医疗机构仍在使用最初级的胶片、玻片作为图像载体进行诊断,但随着数字化趋势的不断推进,人工智能的介入的基础也在不断建立中。


企业在比拼什么?

        相信大家都已经知道,算法、数据是人工智能企业最核心的两大竞争力,而在医疗领域,具体的情况又是如何呢?

   

        首先是算法方面,近年来人工智能算法发展异常迅速,有很多适合企业快速上手的训练框架,加上有大量学术团队公布算法和训练样本,这为初创企业的进入降低了门槛。但是这些公开算法往往只能训练出一个粗浅的产品,只适合作为前期尝试,并且随着应用场景、应用人群的不同都需要对算法和模型做不同程度的改进。目前各种算法处于百家争鸣的态势,各企业间也是博采众长,不断对自身模型进行改进。从长期来看,算法必然会遇到瓶颈,各家企业间的差距也会不断缩小,其重要性也会不断下降,企业必须平衡好高额研发投入的性价比问题。


        而在临床层面,各类算法最终比拼的是准确度。目前行业正处于“风口”,有大量企业拿着公开的算法、样本稍加改动即在市场大肆宣扬,实际产品远远达不到落地的标准。这类企业会在准确度上大做文章,但却不对准确度的定义做解释,有误导之嫌。举个简单例子,我国乳腺癌发病率为每10万人21例,即使算法将每个样本都标记为非乳腺癌,那最终结果对是否乳腺癌患者的识别率也高达99.9%,但在临床上却没有任何意义。因此,谈论准确度必须同时谈论敏感度和特异度,即漏诊率和误报率,才能对算法的准确度有明确的认识。


        其次,如前文所说,当各家间在算法上无太大差距的情况下,数据就成了最重要的核心竞争力了。观察数据有两个维度,一是质量,二是数量。人工智能系统必须通过大量的有效数据来进行训练,改进模型,才能不断提升输出结果的质量。中国拥有庞大人口,各类病例数都在全球领先,理论上数据量并不缺,但关键是数据缺乏有效性,难以投入到模型训练当中。第一,仍有大量的数据没有实现电子化,无法使用,这将依赖于之后电子化系统的普及;第二,数据缺乏标准化规范,市场没有对此形成统一标准,导致企业只能自己花费大量时间进行清洗甚至弃用;第三,数据必须经过统一标准的、高质量的标注,才能作为有效的训练集来使用,对于动辄几十万的数据量来说,数据标注是非常大的挑战和成本投入;第四,医疗数据十分敏感,医院、政府出于安全性考量,对数据外流限制非常严格。因此,在这些因素叠加之下,导致当前适用于我国临床的数据十分匮乏。而国外的数据,又由于针对的人种、环境等等不同,用其训练出来的模型最终输出结果在我国往往会出现较大的偏差,并不适用。因此在数据问题的解决上,人工智能企业都面临着巨大的挑战。


        最后,人工智能企业往往在商业模式上陷入困境。一方面,企业需要稳定的数据来源;另一方面,不论是FDA、CFDA等监管机构,还是医院,对于人工智能都保持着谨慎的态度,产品最好能借助载体进行落地。这就要求企业最好能打造出涵盖各类硬件、信息化系统、人工智能解决方案的平台型企业,占据流量入口,不断积累多维度、海量的数据,并且有能力在语音、图像、自然语言处理上保持领先,形成生态圈。



首页 - 中恒星光金融控股 的更多文章: