人工智能检测到自闭症背后的一类新的突变
DNA中有助于疾病的许多突变不是在实际基因中,而是曾经考虑过“垃圾”的基因组的99%。虽然科学家最近明白,这些巨大的DNA实际上起到了关键的角色,但直到现在,解读这些效果是不可能的。
使用人工智能,普林斯顿大学领导的团队已经解释了这种突变的功能影响自闭症.研究人员认为,这种强大的方法普遍适用于发现基因对任何疾病的影响。
发表在5月27日的杂志上自然遗传学,研究人员分析了一个孩子的1,790个家庭的基因组自闭症谱系障碍但其他成员们没有。该方法在120,000次突变中排序,以找到影响自闭症人们基因行为的方法。虽然结果没有揭示自闭症病例的确切原因,但他们揭示了成千上万可能的研究人员学习的贡献者。
以前的许多研究专注于识别基因本身的突变。基因基本上是制造许多蛋白质的指令,该蛋白质构建和控制身体。基因中的突变导致突变的蛋白质,其功能被破坏。然而,其他类型的突变破坏了基因的调节方式。这些领域的突变影响不是什么基因,但它们的何时以及多少。
研究人员说,到目前为止,还不可能在整个基因组中寻找调控基因的DNA片段,并预测这种调控DNA的突变可能如何导致复杂的疾病。这项研究首次证明了调控DNA的突变会导致一种复杂的疾病。
“该方法提供了一种与任何疾病进行此分析的框架,”计算机科学和基因组学教授和研究的高级作者奥尔加··特洛伊斯卡省该方法对神经系统疾病,癌症,心脏病以及许多具有抵抗遗传原因的努力的其他条件特别有用。
“这改变了我们思考这些疾病可能原因的方式,”Troyanskaya说,她也是位于纽约的西蒙斯基金会Flatiron研究所(Simons Foundation’s Flatiron Institute)的基因组学副主任,在那里她领导了一组共同作者。
该团队还包括由洛克菲勒大学神经透明度罗伯特·达尔纳领导的集团。The first authors of the paper are Jian Zhou and Christopher Park, who earned Ph.D.s at Princeton and are now visiting collaborators at the Lewis-Sigler Institute for Integrative Genomics and researchers at the Flatiron Institute, and Chandra Theesfeld at Princeton's Lewis-Sigler Institute for Integrative Genomics.
最先前的疾病遗传基础的研究专注于20,000名已知基因和调节这些基因的DNA的周围部分。然而,即使这种巨大的遗传信息甚至占人类基因组中32亿化学对的略高于1%。另外99%的99%是被认为是“黑暗”或“垃圾”,尽管最近的研究已经开始破坏这个想法。
在新的发现中,研究团队提供了一种方法来了解这种大量基因组数据。系统使用人工智能一种被称为深度学习的技术,在这种技术中,算法执行连续的分析层,以学习在其他情况下无法识别的模式。在这种情况下,该算法自学如何识别DNA的生物学相关部分,并预测这些片段是否在已知影响基因调控的2000多种蛋白质相互作用中发挥作用。该系统还预测了破坏一对DNA单元是否会对这些蛋白质相互作用产生实质性影响。
Troyanskaya说,该算法“沿着基因组滑动”,分析周围1000个化学对中的每一个化学对,直到它扫描出所有的突变。因此,该系统可以预测突变整个基因组中每一个化学单元的效果。最后,它揭示了一个可能调控基因的DNA序列和可能干扰这种调控的突变的优先列表。
在该计算成果之前,传统的收集此类信息的方法将是每种序列上的胃部实验室实验和每种序列中的每个可能的突变。这种可能的功能和突变的数量太大,无法考虑 - 实验方法需要测试每种突变的每种突变,并在组织和细胞类型中一遍且过度地重复这些实验,其实验量为数千亿实验。其他研究小组通过将机器学习应用于DNA的靶向部分来加速这一发现,但没有达到查看每个DNA单元和每个可能的突变的能力以及对整个基因组的2,000多个调节相互作用的能力.
“我们的论文真的允许您做的是占据所有这些可能性并对他们进行排名,”公园说。“那个优先级序列本身非常有用,因为现在您也可以在最高优先案件中进行实验并进行实验。”
最后,该系统根据已知的致病突变对其进行校准,并开发出一个“疾病影响评分”,这是对给定突变对疾病产生影响的可能性的评估。
在自闭症的情况下,研究人员分析了1,790个家庭的基因组,“单纯克斯”自闭症谱系障碍,这意味着一个孩子在一个孩子中的情况很明显,但不是在家庭的其他成员。(这些数据是从西蒙斯单纯族家庭收集中获取超过2,000家的自闭症家庭。)在这种样本中,少于30%的受自闭症谱系障碍影响的人有一个先前鉴定的遗传原因。研究人员说,新发现的突变可能会显着增加该分数。
预测每个突变的功能效果的能力是这项新研究的关键创新。以前的研究发现,与未受影响的人员相比,检测自闭症人群的监管突变数量的任何差异挑战。然而,新方法看着预测具有高功能影响的突变,发现受影响人群中的这种突变显着增加。
当研究人员然后看待这些突变的基因受到什么时,他们原来是与大脑功能强烈相关的基因。这些新发现的突变影响了类似基因和前面提到的功能突变.
“现在我们开设了现场,了解可能参与自闭症的所有因素,”菲尔德说。
这些信息对家庭及其医生来说也很重要,以更好地诊断这种疾病,并避免过度普遍假设一个人的自闭症如何分类为他人。“他们说,当你遇到一个患有自闭症的人时,你已经遇到了一个有自闭症的人,因为没有任何案件是相似的,”菲尔德说。“遗传上,似乎是相同的。”
通过这种新方法,该团队正在分析各种形式的癌症,心脏病和其他疾病的遗传原因。
进一步探索
用户评论