一名本科生发现与侵袭性脑癌相关的基因
Oncotarget, doi:10.18632/oncotarget.24228" width="800" height="530">
当李兰德伍德的生物化学本科研究员接近了他的PI时想在2016年春天开始研究“一些人类的东西”,他并没有想象它会导致发现22种含有胶质母细胞瘤的基因,最具侵略性的脑癌。
“我绝对没有来克莱姆森思考脑癌研究,“Dunwoodie说。”我正在用葡萄和其他植物的项目努力。我告诉(亚历克斯)菲尔斯博士,我想做一些人类的东西,他说,'那很酷 - 选择一个器官。“
在与家人咨询后 - 他应该研究大脑还是心脏?- Dunwoodie在大脑上决定,特别是脑癌。在Van Andel Institute的先前暑期实习旨在兴趣癌症研究。
两年后到2018年1月在杂志上发表Oncotarget,Dunwoodie的学习是第一个描述的学习胶质母细胞瘤- 特异性基因的共同表达关系在22个特定基因之间。
在新闻中听到的是,美国副院长乔·贝登的已故的儿子约翰麦凯恩和博拜登的疾病,胶质母细胞瘤是高度恶性的,其特征在于它的致命性。胶质母细胞瘤的患者在诊断后仅为14.6个月的中位存活时间。
“与许多其他肿瘤,疾病和复杂的性状一样,胶质母细胞瘤由各种遗传和表观遗传因素控制,”Dunwood说。“如果这些癌症有一个主监管机构,我们会说,”我们要毒品,我们每年都会节省数百万的生命“,但胶质母细胞瘤中有更多的事情我们可以目前识别。“
然而,胶质母细胞瘤的复杂性适合在遗传学和生物化学系的Foltus'遗传学实验室教授的研究,其中Dunwoodi是一名学生。系统遗传学,随着实验室的名义意味着,使用基于计算机和数学的方法来分析生物系统,例如基因和监管途径。
为了使发现,Dunwoodie从两个在线公共数据库中编制数据,用于基因组信息:癌症基因组图集(TCGA)和国家生物技术信息中心(NCBI)。
从TCGA下载了超过2,000个肿瘤表达数据集,每一个详细介绍肿瘤细胞如何与遗传水平的正常细胞不同。在数据中包含五种不同类型的肿瘤,包括来自膀胱,卵巢,甲状腺,较低的胶质瘤和胶质母细胞瘤癌症的肿瘤,以实现圆满的案例研究。
2000多个数据集,每个数据集显示了大约75000个基因,然后被组织成一个基因表达矩阵(GEM),一个量化每个样本中每个基因表达水平的表。例如,从TCGA中提取的一种名为LAPTM5的基因,对一种参与血细胞形成的蛋白质进行编码。在基因表达矩阵中,LAPTM5在每一种肿瘤类型中进行评估,以判断它在一种肿瘤类型中是过度活跃(过表达)还是不活跃(低表达),通过数字排名来表明。然后对TCGA数据中5种肿瘤类型的74999个剩余基因进行了相同的评分过程。
一个独立的GEM包含了来自NCBI数据库204个数据集的21万个基因——包括正常大脑样本、胶质母细胞瘤大脑样本和帕金森氏症患者的大脑样本——独立创建用于比较。Will Poehlman是系统遗传学实验室的一名研究生,他协助Dunwoodie准备了这些GEMs。
使用菲尔斯和前研究生斯蒂芬·菲克林开发的小说计算机软件 - 现在是华盛顿州立大学的助理教授 - Dunwood然后能够将Gems转化为两种不同的基因共表达网络(GCNS),视觉表示提供对基因如何相互交互的洞察的数据。
这个软件包被称为知识独立网络构建(KINC),它的新颖之处在于,它发现了基因之间的表达关系,而研究人员无需进行任何事先分析。这种知识独立的方法减少了“噪音”的数量——来自实验室协议或细胞之间的自然变化——这些噪音可以阻止基因相互作用被发现。
“通过两个GCN,我们发现一组22个基因在癌症基因组地图集网络和NCBI脑网络中的单一模块中共同表达,”Dunwoodie说。“只有大约70个基因重叠在两个网络之间,其中22个是相同的模块 - 同一组的共同表达基因。重叠真的很容易发现。”
虽然认为基因 - 在免疫系统中的许多功能 - 彼此喂食以影响胶质母细胞瘤的基因,但Dunwood说这不是精确的情况。
“很难说它们在一起工作,因为它们是相互关联的。所以,如果A和B在同一天跑了8英里,这并不一定意味着他们在一起跑。”“更有可能的是,这些基因正以同样的方式受到调控,而且可能有几个因素在调控它们,目前我们还无法确定。”
更重要的是,这22个基因,在胶质母细胞瘤和非癌样本之间进行比较时,被发现在胶质母细胞瘤中有更强的共同表达水平,这表明了一种疾病特异性的调节机制。当将胶质母细胞瘤与恶性程度较低的胶质瘤(一种侵袭性较低的脑癌)进行比较时,也发现了同样的结果,表明这22个基因具有胶质母细胞瘤特异性活性。该研究的另一个值得注意的发现是,这22个基因与间充质胶质母细胞瘤(一种独特的癌症亚型)更相关,当这些基因高表达时,它们减少了间充质组患者的生存时间。
正如研究中的情况一样,回答一个问题就会产生大量的新问题,该团队的研究仅仅是了解胶质母细胞瘤发病机制的一步。
“找出22个基因具体做的事情会很高兴,”邓伍德说。“它们是否在周围的免疫细胞中表达?它们是癌症的原因,还是它们是癌症的影响?吗?癌症传播他们的表情?为什么这一点基因在那里共同表达,他们所做的是尚未回答的问题。“
邓伍迪计划上医学院,成为一名医生信息学家。他说,他在系统遗传学实验室学到的工具和方法将在他的职业生涯中长期坚持下去。
“癌症研究很有趣,因为有这么多惊人的人,这么多令人惊叹的事情 - 但这只是桶里一滴,”邓伍德说。“对我来说,真正的目的是被治愈的患者。出版的纸张很棒,但由于这个,没有人立即治愈,这是最终目标。”
进一步探索
用户评论