Press "Enter" to skip to content

纽约大学的研究人员创建了一个基因组学的神经网络,可以解释其预测结果的原因

<img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/10/Screenshot-2023-10-28-at-10.56.36-PM-1024×542.png”/><img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/10/Screenshot-2023-10-28-at-10.56.36-PM-150×150.png”/><p>在生物研究领域,机器学习模型在推动我们对复杂过程的理解方面取得了重要进展,尤其是在RNA剪接方面。然而,该领域许多机器学习模型的共同局限性是缺乏可解释性——它们可以准确预测结果,但很难解释它们如何得出这些预测结果。</p><p>为了解决这个问题,纽约大学的研究人员提出了一种“按设计可解释”的方法,不仅确保准确的预测结果,还提供对基本生物过程,特别是RNA剪接的洞察。这种创新模型有望显著提高我们对这一基本过程的理解。</p><p>神经网络等机器学习模型在生物科学中的科学发现和实验设计方面发挥了重要作用。然而,它们的非可解释性一直是一个挑战。尽管它们的准确性很高,但它们通常无法解释其预测结果的逻辑。</p><p>通过创建一个专门设计为可解释的神经网络模型,该新方法克服了这个局限性,并保持了与最先进模型相当的预测准确性。这种方法在该领域是一个突破,因为它在准确性和可解释性之间搭建了桥梁,确保研究人员不仅拥有正确的答案,还可以理解这些答案是如何得出的。</p><p>该模型经过精心训练,重视可解释性,使用Python 3.8和TensorFlow 2.6。调整了各种超参数,并通过逐步引入可学习参数的渐进步骤来进行训练。通过引入正则化项进一步增强了模型的可解释性,确保学到的特征简明易懂。</p><p>该模型的一个显著特点是它具有泛化能力,并能对来自不同数据源的各种数据集进行准确的预测,突显了其健壮性及其捕捉剪接调控逻辑的重要方面的潜力。这意味着它可以应用于不同的生物环境,为不同的RNA剪接情景提供宝贵的洞察。</p><p>该模型的体系结构包括序列和结构滤波器,这在理解RNA剪接中起着关键作用。重要的是,它对这些滤波器进行定量强度的赋值,揭示了它们对剪接结果的影响强度。通过名为“平衡图”的可视化工具,研究人员可以探索和量化多个RNA特征对个体外显子剪接结果的贡献。该工具简化了对剪接过程中各种特征的复杂相互作用的理解。</p><p>此外,该模型不仅确认了先前建立的RNA剪接特征,还发现了与扩展环结构和富G序列相关的两个未描述的外显子剪接特征。这些发现具有重要意义,并已经进行了实验证实,进一步证明了模型的可信度和这些特征的生物相关性。</p><p>总之,“按设计可解释”的机器学习模型在生物科学领域中代表着一个强大的工具。它不仅实现了高度准确的预测,还清晰而可解释地理解了RNA剪接过程。该模型量化特定特征对剪接结果的贡献的能力在医学和生物技术领域有着多种应用潜力,从基因组编辑到RNA基于治疗方法的开发。这种方法不仅限于剪接,还可以应用于解读其他复杂的生物过程,为科学发现开辟新的道路。</p>

Leave a Reply

Your email address will not be published. Required fields are marked *