Press "Enter" to skip to content

“一种基于机器学习的方法来预测胶质母细胞瘤患者MGMT甲基化状态”

肿瘤放射组学

National Cancer Institute在Unsplash上的照片

介绍

今天,我们将探讨一项发表在《自然》科学报告杂志上的针对胶质母细胞瘤患者的研究:通过基于遗传算法的机器学习方法优化放射组学特征改善MGMT甲基化状态预测。该研究的目标是尝试预测O6-甲基鸟嘌呤-DNA-甲基转移酶(MGMT)的甲基化状态。之所以能够预测这种状态的重要性在于它可以成为化疗药物替莫唑胺(TMZ)治疗的有效性的良好指标。

替莫唑胺概述

替莫唑胺是一种通过损伤癌细胞的DNA而导致细胞死亡的烷基化剂。替莫唑胺还使细胞对放射线更敏感。这在癌症治疗中是一个重要因素,因为放射线可以帮助杀灭癌细胞。

该研究旨在通过机器学习找到一种新的方法来预测MGMT甲基化状态。如果成功,这可以帮助减轻目前为获取所需的肿瘤标本进行测试而存在的一些技术限制和侵入性操作。

鉴于胶质母细胞瘤(GBM)的致命性,对于发展这种肿瘤的患者,高效而有效地处理是非常重要的。GBM的中位生存期为14-16个月,占所有恶性中枢神经系统肿瘤的45%。

方法

该团队试图利用两阶段方法来预测适当的MGMT甲基化状态。首先通过消除嘈杂的放射组学特征,然后通过将分类算法应用于基因算法,以帮助识别最佳预测特征。

在这项研究中测试了各种机器学习技术。目的是找到最有意义的放射组学特征进行预测。他们通过从磁共振成像(MRI)中提取多模态图像的放射组学特征来实现这一目的。两阶段特征选择方法首先使用极限梯度提升(XGBoost)模型,然后使用基于遗传算法(GA)的包装器模型。GA模型的工作方式类似于自然选择,即识别出适合于预测的“最适应”特征集。

使用的数据是来自The Cancer Genome Atlas的经预处理和分割的多模态MRI特征。总共包括53例GBM患者,获取了704个放射组学特征。

遗传算法的工作流程阶段包括六个不同的步骤:生成初始种群、适应度评估、选择父代、交叉、变异和种群替换为下一代。选择概率的公式(根据其在适应度评估阶段的性能选择特征)如下所示:

选择概率公式

一旦从XGBoost算法中提取了初始特征,就可以使用这些特征进行分类,预测哪些患者属于MGMT甲基化和非甲基化的类,并将其用作适应度评估。他们尝试将三种不同的机器学习算法引入到遗传算法工作流程的适应度评估部分。他们使用了随机森林(RF)、XGBoost和支持向量机(SVM)。为了实施这些算法,他们利用了Python机器学习库SKlearn。

结果

一旦训练了三种不同版本的算法,就使用三种不同的度量方法评估模型的性能:准确度、特异度和召回率。为了比较性能,他们使用20次交叉验证的平均值,并使用Kolmogorov-Smirnov测试进行评估。

随机森林算法与遗传算法(GA-RF)结合使用取得了最佳结果。该技术在所有评估指标中表现优异,准确度为0.925,灵敏度为0.894,特异度为0.966。

在GA-RF模型完成后,存在一个由22个放射组学特征组成的最优子集。这些特征包括17个纹理特征、3个基于直方图的特征、1个体积特征和1个强度特征。纹理特征可以通过反映体素的空间强度相关性和分布来帮助临床医生量化血流、水肿和坏死的“多区域变化”。直方图特征可用于说明图像中出现的强度值的频率分布。

扩展应用案例

为了测试模型的更广泛适用性,团队在一个新的数据集上使用了学习到的特征。这次他们使用的数据集是关于低级别胶质瘤(LGG)患者的。他们直接应用了学习到的特征,并没有进行任何额外的特征选择。

GA-RF模型在LGG数据集上的结果是准确率为0.75,敏感度为0.78,特异度为0.62。在没有进行任何迁移学习或微调的情况下,这些都是有希望的结果。

通过在LGG数据集上应用特征并取得良好的性能,研究人员能够展示这些特征在其他类似疾病中有潜在的重复利用价值。

局限性

这种技术的一个潜在局限是,在患者数量较少的情况下,研究人员可能会遇到高维度相关问题。当特征数量与可用的训练数据量相比较高时,会出现这种情况。如果发生这种情况,学习数据与目标变量之间的准确关系可能会具有挑战性。

高维度问题在放射组学领域是一个普遍存在的问题,不仅仅局限于这项研究。为了克服这个局限,团队使用了交叉验证来更加确定他们所获得的结果。

交叉验证概述

交叉验证通过将用于训练和测试的数据分为不同的组,在每次验证的迭代中使用不同的组。通过多次这样做并取结果的平均值,您可以更加有信心地认为您的模型能够反复获得其所给出的结果。

在癌症治疗中,临床医生依赖肿瘤特征和分级,以便为化疗、放疗和手术优化治疗方案。

结论

如果这种技术继续发展并最终得到应用,它可能成为医生非侵入性了解其患者的MGMT甲基化状态的一种方式。这些信息可以帮助他们做出更明智的治疗决策,从而帮助患者获得更好的预后。这也为放射组学在肿瘤学中的其他潜在应用打开了大门。

Do, D.T., Yang, MR., Lam, L.H.T. et al. “Improving MGMT methylation status prediction of glioblastoma through optimizing radiomics features using genetic algorithm-based machine learning approach.” Sci Rep 12, 13412 (2022). https://doi.org/10.1038/s41598-022-17707-w

Eberhart, Karin, Ozlem Oral, and Devrim Gozuacik. “Chapter 13 — Induction of Autophagic Cell Death by Anticancer Agents.” ScienceDirect, 2014, https://www.sciencedirect.com/topics/neuroscience/temozolomide#:~:text=Temozolomide%20(TMZ)%20is%20a%20small,damage%20and%20tumor%20cell%20death. Accessed 12 July 2023.

National Cancer Institute. “Trials Produce Practice-Changing Results for Brain Cancer.” Cancer Currents Blog, 9 June 2016, https://www.cancer.gov/news-events/cancer-currents-blog/2016/asco-temozolomide-brain. Accessed 18 July 2023.

American Cancer Society. “How Chemotherapy Drugs Work.” American Cancer Society, 22 Nov. 2019, https://www.cancer.org/treatment/treatments-and-side-effects/treatment-types/chemotherapy/how-chemotherapy-drugs-work.html. Accessed 25 July 2023.

European Society for Medical Oncology. “MGMT Promoter Methylation in Glioma: ESMO Biomarker Factsheet.” Oncology Pro, [updated 2019 Jan 18], https://oncologypro.esmo.org/education-library/factsheets-on-biomarkers/mgmt-promoter-methylation-in-glioma. Accessed 9 July 2023.

Creative Commons license link: https://creativecommons.org/licenses/by/4.0/

Leave a Reply

Your email address will not be published. Required fields are marked *