教学电脑阅读健康记录帮助COVID-19战斗
医疗记录是一个丰富的健康数据。结合时,它们所包含的信息可以帮助研究人员更好的理解疾病和更有效地对待他们。这包括COVID-19。但是打开这一丰富的资源,研究人员首先需要阅读它。
我们可能从手写的医疗记录,但记录的信息,在现代电子健康记录一样难以获取和解释。这是一个老笑话,医生的书写字迹模糊的,但事实证明他们的打字不是更好。
健康档案中包含大量的信息是惊人的。每一天,医疗人员在一个典型的NHS医院产生如此多的文本需要人类的年龄只是滚动,更不用说读它。使用电脑来分析这些数据是一个明显的解决方案,但远非简单。完美的意义人类能电脑是非常难以理解。
我们的团队是使用一种人工智能来填补这一缺口。通过教学计算机如何理解人类医生指出,我们希望他们会发现见解如何对抗COVID-19通过模式在许多成千上万的病人的记录。
为什么健康记录是很难去
很大一部分的健康记录是由自由文本,类型以叙述的方式就像一个电子邮件。这包括病人的症状、疾病的历史,指出对预先存在的条件和他们服用的药物。可能还有相关信息对家庭成员和生活方式的混合。因为本文进入了忙碌的医生,也会有缩写、错误和拼写错误。
这种信息被称为非结构化数据。例如,病人的记录可能会说:“史密斯太太是一个65岁的妇女与心房颤动和CVA的3月。她有一个# NOF和OA的历史。乳腺癌的家族史。她一直apixaban规定。无出血史。”
这种高度紧凑的段落包含关于史密斯太太的大量数据。另一个人阅读笔记会知道哪些信息是重要的,可以在几秒钟内提取,但电脑将会发现非常困难的任务。
教学机器读
为了解决这个问题,我们使用一种叫做自然语言处理(NLP)。基于机器学习和人工智能技术,NLP算法自由文本中使用的语言转换成标准化的、结构化的医学术语集可以通过计算机进行分析。
这些算法非常复杂。他们需要理解上下文,长串的单词和医学概念,区分当前事件和历史的,确定家庭关系等等。我们教他们这样做给他们现有的书面信息,这样他们就可以学习用语的结构和意义,这种情况下,公开的因特网英语文本,然后使用真正的医疗记录进行进一步的改进和测试。
使用NLP算法分析和提取数据从改变医疗健康记录潜力巨大。多在叙事文本的病人的笔记通常是再也没有出现过。这可能是重要的信息预警等严重的疾病,比如癌症和中风的迹象。能够自动分析和标记重要的问题可以帮助提供更好的治疗,避免延误诊断和治疗。
寻找COVID-19战斗
通过归集健康记录使用这些工具,我们现在使用这些技术模式相关的大流行。例如,我们最近使用我们的工具来发现是否常用治疗药物高血压、糖尿病等情况血管紧张素转换酶抑制剂(acei)和血管紧张素受体阻滞剂(arb)——增加与COVID-19成为重症的机会。
导致COVID-19感染细胞的病毒被绑定到一个叫做ACE2分子在细胞表面。acei和arb而被认为ACE2的数量增加细胞表面,导致担心这些药物可以把人们从病毒的风险增加。
然而,所需的信息来回答这个问题:许多重症COVID-19患者被规定这些药物可以被记录为结构化的处方和自由文本医疗记录。自由文本computer-searchable格式需要机器来回答这个问题。
使用我们的NLP的工具,我们可以分析的匿名记录1200 COVID-19患者,比较临床结果和是否患者服用这些药物。令人放心的是,我们发现人们规定acei或arb更不可能是重症比未服用的药物。
我们现在扩大我们如何使用这些工具来找到更多关于从COVID-19谁是最危险的。例如,我们使用调查的链接种族之间,存在的卫生条件和COVID-19。这样的揭示了一些引人注目的事情:黑色或混合种族的会让你更容易与疾病住院,亚洲病人,在医院的时候,面临更大的风险,住进了重症监护病房或死于COVID-19。
我们也使用这些工具来评估早期预警评分预测哪些病人入院最有可能病情加重,并建议额外的措施可以用来改善这些分数。我们也利用这一技术预测即将到来的激增COVID-19的情况下,根据病人的症状,医生有记录。