科学家打造新型AI模型,检测19360张多模态影像,实现乳腺癌风险的病理级别精准分级
新浪AI
近日,上海科技大学助理教授钱学骏和合作者开发出一种多模态 AI 系统——BMU-Net 模型,推动了乳腺癌筛诊方法的发展 [1]。
BMU-Net,是一个结合传统卷积神经网络与 Transformer 的混合深度学习框架。通过引入不同癌变风险等级的乳腺疾病树,课题组实现了多层级乳腺癌风险预测。
研究中,该团队利用 5025 名患者的 19360 张乳腺影像开展了本次模型的开发和测试。
相比由资深放射科医生进行的 158 例钼靶检查诊断结果和 146 例超声检查诊断结果,BMU-Net 在乳腺癌良恶性分类上与专家水平相当,在组织病理学分级诊断上则能超越人类专家的表现。
针对 187 名患者进行前瞻性多模态数据验证时,BMU-Net 取得 90.1% 的准确率,这已经非常接近人类专家 92.7% 的准确率。
针对乳腺癌和其他乳腺疾病的风险分层,该 AI 系统提供了一个精细化的全新解决方案。
其以精准的乳腺癌风险分层能力为基础,为健康筛查和门诊病人的检测与管理提供一条智能化的路径,不仅在医疗实践中具有显著的应用价值,也能带来重要的社会价值和经济效益。
总的来说,这一系统的预测能力强于资深放射科医生,并能初步达到资深病理科医生的水准,为乳腺癌的筛查和诊断提供了新途径。
钱学骏表示,本次研究是针对多模态 AI 在乳腺癌风险分层上开展的可行性验证,预计经过进一步的数据调优、工程化验证之后,可以广泛用于不同层级的筛查与诊断。
同时,它还将助力于满足国家“两癌”筛查战略需求,通过提高早期诊断的效率与准确性,助力提升整体医疗服务质量、改善患者预后以及减少公共卫生负担。
(来源:Nature Biomedical Engineering)
中国乳腺癌患者的发病特点:高、快、早
据钱学骏介绍,乳腺癌是全球女性中发病率最高的癌症。而在中国它呈现出三个显著特点:首先,发病率基数高;其次,患者增速是全球平均增速的两倍(居世界首位);最后,发病年龄更早,中国患者的平均发病年龄较西方国家提前十年。
然而,乳腺癌患者如能得到及时治疗,其患病五年后生存率可以高达 90% 以上。
因此,早期的筛查与诊断对于乳腺癌的防治至关重要,甚至比之后的治疗措施更重要。正因此,从 2009 年开始国家将“两癌”(乳腺癌和宫颈癌)筛查列入重大公共卫生服务项目。
在乳腺癌的筛查和诊断中,需要针对庞大且具多层次特点的人群提供解决方案,要想实现从一线城市到二三线城市再到乡村的广泛覆盖,就要求影像检查设备具有成本低、可及性强和检测准确度高等特点。
然而,由于种族构成(比如致密性乳腺与脂肪性乳腺的差异)、经济条件和社会因素等不同,该领域逐渐发展出两个主要的检查思路。
在欧美等西方国家,通常以钼靶为主,超声为辅。而在亚洲等东方国家尤其是中国,超声通常是主要的筛诊工具,钼靶则主要起到辅助作用。
当然,具体选择要根据每位患者的具体情况而定,并非一成不变。总体而言,超声和钼靶影像各有优缺点,两者互为补充,能够形成有效的合力,同时这也是当前乳腺癌筛查与临床诊断的普遍共识。
经过长期的临床实践总结,全球范围内形成了“钼靶+超声”这一黄金组合策略,以便提供更准确、更全面的乳腺癌筛查与诊断。
在乳腺癌的体检中,许多常规体检套餐都会要求体检者在乳腺超声和钼靶影像这两者之间选择其一;门诊医生则会根据患者的具体情况选择适合的检查方式,必要时两者结合使用。这一情景也是上述“黄金组合”的真实写照。
之所以这样组合是因为:尽管超声影像技术在乳腺疾病的诊断中具有无辐射、成本低以及广泛可用的优点,但其在探测癌症早期迹象,特别是微小钙化灶方面相对不够敏感。
而钼靶影像正是弥补这一不足的关键工具,这也是为何在国际范围内钼靶影像常被推荐为乳腺癌筛查唯一标准的原因。
影像学检查,是乳腺癌筛查与早期诊断的重要环节,但并非唯一的判断依据。患者的主诉、既往病史以及临床发现,同样是医生做出精准诊断的重要参考。
超声影像的解读高度依赖于医师的经验,这也是该技术面临的主要限制。此外,乳腺癌的筛诊往往需要针对一系列的指标、参数和影像进行综合评估,而这会带来巨大的数据量和分析挑战。
值得注意的是,这些解读所面临的挑战恰好是 AI 技术所擅长解决的,即 AI 具有提供稳定且高效影像解读的能力,从而能够减少人为偏差。即通过处理多种输入信息进行融合学习,实现高效且稳定的诊断。
作为一名致力于医学超声技术开发的学者,钱学骏非常明白超声诊断的重要性以及其广泛的应用潜力。
正是因为无辐射、低成本且易于普及的特点,超声影像才得以成为中国乳腺疾病检测首选方案。因此,他和合作者多年前就开始着手利用多模态超声影像数据来辅助乳腺癌的诊断。
而之所以开展本次研究,是因为他和合作者希望为这项需求量极大、检测范围广泛、需要长期监测的工作提供更好的智能化支持,进一步推动乳腺癌筛查和诊断工作的进步与优化。
用 AI 为“黄金组合”锦上添花
需要指出是,尽管乳腺磁共振成像也是一种用于乳腺检查的常见手段,但由于其昂贵的成本和严格的使用条件(需要专门的场地和乳腺线圈),其更适合用于乳腺癌确诊后的分期评估或术后监测,因此并不适合用于大规模的常规筛查与门诊检查。而多模态影像策略则有助于提升早期乳腺癌的筛查与诊断效率。
影像学检查,在现代医学实践中占据着重要地位。然而,到底该选择哪种影像检查方式,需要医生在综合考量患者的主诉、既往病史以及临床发现后做出决策。
因此,临床指标不仅可以指导后续的影像检查选择,也是全面评估病患状况的关键因素之一。
例如,对于年轻患者(如 30 岁),医生通常会优先考虑超声检查,而非选择会产生辐射的钼靶影像。至于最终的诊断结论,一般由超声报告和临床观察共同决定。
鉴于此,本次研究也将临床问诊纳入模型的构建之中。钱学骏表示,这一环节的复杂性远超影像信息的处理。
对于钼靶和超声图像的影像数据获取来说,这是一个相对流程化且规范的操作,只需经过脱敏和安全检查之后,这些图像数据就能很好地进行保存。
然而,临床信息的获取则难度更高。此类信息的记录依赖于与患者的直接交流,只有这样才能获取他们的年龄、身高、体重和病史等信息。
但是,这种方式常常面临患者在信息提供上的犹豫,这也是本次项目所面临的一个挑战。
不过,经过团队的不懈努力,课题组最终克服了这些困难,顺利完成了数据的全面整合。
(来源:Nature Biomedical Engineering)
钱学骏表示,在当今的精准医疗时代,疾病的鉴别诊断对于优化患者的治疗方案和疾病管理具有重要意义。
因此在本次项目中,他们摒弃了传统的简单良恶性分类方法,转而采用更为有效的树状结构分类法。
这种结构在处理和组织层次化的信息时十分有用,非常有助于他们直观地理解各种数据的结构和关系。
比如,在该团队设计的乳腺疾病树中,第一层是乳腺疾病(根节点),接下来细分为良性疾病(一级子节点),再往下分为风险很低的良性病变(二级子节点),最终到达具体的乳腺纤维腺瘤(叶子节点)。
这种树状结构的优势在于,它允许研究人员从根节点出发,通过层级结构逐步深入,从而明确地得出粗粒度或细粒度的诊断结果,进而支持医生做出更全面和个性化的判断。
与此同时,AI 模型的构建通常需要大量的数据。然而,在该领域他们很难收集到大规模完整匹配的钼靶信息、超声信息和临床信息。
因此在实际临床中,患者可能不会进行所有类型的检查,这就导致多模态数据的不完整问题非常常见。
为解决这一难题,他们开发出一种模块化 AI 模型设计策略。在这种设计中,每个模块采用单独数据集进行独立训练。
这样一来即便多模态数据集较为稀缺,但是单一的超声或钼靶数据集则相对更易获取。
通过利用这些单独的数据集,可以先行训练各自模块,随后在完整模型的搭建过程中,通过少量匹配数据进行整体微调从而实现多模态的整合。
值得一提的是,这一构建与微调的过程是持续且复杂的。在癌症研究中,目标人群本身就相对小众,而当他们进一步细分至乳腺疾病树的具体癌症类型时,目标样本量更是有限(例如原位癌)。
事实上,这里涉及到 AI 模型设计中的经典问题:长尾效应。针对此他们通过一系列技术手段进行优化,比如利用调整训练策略、优化损失函数、随机采样以及迁移学习等,来提升少样本类别的识别准确性,同时还不会影响其他类别的表现力。
图 | 相关论文(来源:Nature Biomedical Engineering)
最终,相关论文以《一种用于分层乳腺癌风险的多模态机器学习模型》(A multimodal machine learning model for the stratification of breast cancer risk)为题发在 Nature Biomedical Engineering(IF 26.80),钱学骏是第一作者兼通讯作者。
另据悉,钱学骏于 2019 年在美国南加州大学获得生物医学工程博士学位,后在该校从事博士后研究。
随后,他回国加入上海科技大学,目前主要研究多模态医学数据融合方法、超快速高分辨率超声成像技术以及人工智能在医学影像中的应用。
参考资料:
1.Qian, X., Pei, J., Han, C.et al. A multimodal machine learning model for the stratification of breast cancer risk. Nat. Biomed. Eng (2024). https://doi.org/10.1038/s41551-024-01302-7
运营/排版: 何晨龙