在开源平台Galaxy上发布的冠状病毒数据分析
来自弗莱堡大学的沃尔夫冈·迈尔博士和Björn Grüning博士,以及来自比利时、澳大利亚和美国大学的研究人员,审查了以前关于新型冠状病毒序列的数据,并在德国发表了他们的分析开源平台Galaxy.这两位弗赖堡生物信息学家希望这将促进有关当局、研究所和实验室之间的数据交换。弗莱堡大学的研究人员已经在bioRxiv门户网站上记录了他们的方法和结果。
Galaxy平台适用于生命科学领域的大数据分析。公共服务器为科学家提供免费获取分析工具和可重复的评估程序。Maier、Grüning和他们的同事使用Galaxy系统重新分析了所有公开的COVID-19基因组数据。Grüning解释说,以前的出版物在数据分析方面往往缺乏透明度。例如,Grüning说,在2月初发表的四项关于COVID-19基因组的研究中,只有一项包含所使用原始数据的明确信息。“而且这些分析也没有很好的记录,也不可重复。”因此,无法理解或核实各自的陈述。
几天之内,团队就能够将相同的工作流程应用到每个可用的序列上,并通过Galaxy公开访问它们。因此,世界各地的研究人员现在可以访问欧洲、美国和澳大利亚的银河服务器网络,不仅可以对数据进行评估,还可以作为他们自己对COVID-19数据进行研究的科学基础设施。这意味着科学家们将能够在公共服务器上分析新的COVID-19数据集,这些数据集发布后数小时内,通过与分析当前数据相同的工作流程进行分析。
Maier说,研究人员一致认为,目前在COVID-19研究中缺乏数据交换。随着《银河》的出版,这种情况应该有所改变。应对COVID-19疫情等突发公共卫生事件必不可少的全球合作,最终需要无限制地获取数据、分析工具和计算基础设施。”
银河项目由美国宾夕法尼亚州立大学发起,并在弗莱堡大学的“医学表观遗传学”合作研究中心进一步发展,并作为德国生物信息学基础设施网络(de.NBI)的一部分。欧洲服务器位于弗莱堡大学的IT服务部,是作为一个社区项目设计的。这些数据可以在网上免费获取。希望使用该服务器的科学家不需要有任何编程技能。所有的分析都可以通过图形用户界面进行设置。由弗莱堡大学计算机科学系教授Rolf Backofen博士领导的团队负责Galaxy的进一步开发。