新的“遗传条形码”技术建立了从RNA中获取DNA信息的能力
西奈山医学院的研究人员已经开发出一种方法,可以从非DNA来源(如rna)中获得足够的DNA信息,以清楚地识别那些生物数据存储在大量研究数据库中的个体。当收集高维数据用于研究目的时,这种方法可能会引发关于保护个人身份的能力的问题。一篇介绍这项技术的论文发表在4月8日的《美国医学杂志》网络版上自然遗传学.
DNA包含在每个活细胞的发育和功能中使用的遗传指令。核糖核酸在细胞中充当传递遗传信息的信使,使组织正常运转所需的绝大多数过程得以进行。
到目前为止,访问数据库与DNA信息一直受到限制和保护,因为它一直被认为是每个人的唯一基因指纹。然而,大量的RNA数据已经通过美国和欧洲的一些数据库公开提供。这些数据库包含了来自世界各地的数千项基因组研究。
在这项研究中,主要作者Eric E. Schadt博士和Ke Hao博士开发了一种技术,通过在任何组织中监测基因表达水平,可以从RNA数据推断出一个人的DNA。相比之下,大多数涉及DNA和RNA的研究都是从DNA序列开始,然后试图将表达模式与群体中个体之间的DNA变化联系起来。这是第一次从RNA水平到DNA序列的描述。
Schadt博士说:“通过观察给定组织中的RNA水平,我们可以推断出一种基因型条形码,这种条形码可以唯一地标记个体,从而使个体与独立衍生的DNA样本相匹配。”Schadt博士是基因组学和多尺度生物学研究所所长,基因组学的Jean C.和James W. Crystal教授,西奈山医学院遗传学和基因组学科学系的主席。“这些信息的潜在用途是巨大的。基因型条形码不仅可以从RNA中推断出来,而且一些组织中的RNA水平不仅可以告知年龄和性别等个人特征,还可以告知阿尔茨海默氏症和癌症等疾病,以及患这些疾病的风险。”
Schadt补充道:“我们发现的意义超出了医学范畴。例如,来自参与研究的个人的条形码,其中RNA水平被监测并存入公开的数据库,可以与留在犯罪现场的DNA样本进行测试,作为识别感兴趣人员的一种方式。”
从基因表达模式推断一个人的DNA序列可能会在医疗保健和隐私方面产生影响。虽然已经制定了具体的法律和政府法规来保护基于DNA的信息不被滥用,但尚不清楚这些法律是否适用于RNA——尽管这项研究表明,与DNA相比,RNA在更深层次上具有关于个人当前健康状态的信息。
“考虑到我们有能力收集海量个人信息,与其开发进一步保护个人隐私的方法,不如建立一个接受新型高维数据深刻反映我们是谁这一事实的社会,这样做会更好,”沙特博士说。“我们需要接受这样一个现实,即很难——如果不是不可能的话——向他人屏蔽个人信息。这类似于试图保护个人隐私,比如在公共场所。”
Schadt博士说,他希望这项研究能引发一场讨论,最终有助于解决有关隐私的争论,并鼓励患者提供数据,帮助医生更好地诊断和治疗他们的病情。对DNA和其他生物信息的更多获取和数量的增加也将有助于医学科学的更大利益。
在自然遗传学学习,Drs。西奈山医学院遗传学副教授Schadt和Hao,以及华盛顿大学生物统计系的Sangsoon Woo博士,分析了来自欧裔美国人捐赠的378个用于移植的肝脏的RNA和DNA,以及来自同一人群的580人的肝脏和脂肪组织,这些人接受了胃旁路手术。作者发现,许多基因的RNA水平与年龄、性别、体重以及糖尿病和心脏病等疾病的其他风险因素有关,但在许多情况下,它们也与特定个体特有的DNA变化有关。
研究人员使用了一种算法,将基因表达模式与基因组中1000个单dna碱基位点的变异相匹配。它是整合生物学的一种应用,可以检查数据的多个维度(DNA和RNA),以更好地通知给定的维度(RNA)。
“DNA和RNA的关系就像一个管弦乐队和它演奏的交响乐,”Schadt这样描述这项新技术。“DNA(管弦乐队)保持不变,而RNA模式(音乐的质量)会随着外界因素的变化而变化。这项新技术就像听一场交响乐,并推断出管弦乐队中有哪些乐器,从本质上解开了发育过程,将组织样本追溯到RNA和指导它的基因。”
进一步探索