中国基因网您的位置:首页 >医学 >

生物制药领域的AI因涉及数据企业文化的挑战而放缓

生物制药正在热身为人工智能(AI),但在药物开发商广泛使用之前,需要解决一系列挑战,一组行业高管表示同意。昨天在纽约市举行的纽约生物伦理委员会2019年年会上,小组成员发现这些挑战是找到更多更好的数据,整合来自多个来源的数据,并建立伙伴关系来收集和分析这些数据。

生物制药领域的AI因涉及数据企业文化的挑战而放缓

该小组还提到了超越数据的挑战,例如吸引能够应用人工智能的新一代专业人员以及机器学习等相关技术,并使生物制药适应新技术。

这些观察结果与皮斯托亚联盟今天发布的一项研究一致,该联盟是由阿斯利康,葛兰素史克(GSK),诺华和辉瑞的高管组成的150多名成员组成的全球非营利组织。该联盟对美国和欧洲的190名生命科学专业人员进行了调查,其中52%的人认为获取数据,44%的人缺乏技能,这是采用人工智能和机器学习的两个主要障碍。

“我们必须实施如此多的文化变革,以便构建我们的行业,以利用分析,推动它。今天,我们不会激励我们的科学家注释,策划他们的数据,以便为分析做好准备,“Eli Lilly研究信息官Ramesh Durvasula博士说。“我们没有一个系统可以激励化学家充分注释他们的电子实验室笔记本,这样我们就可以进行文本挖掘和其他AI功能。

“他们写下合规所需的最低要求,然后他们继续进行下一个实验,这样当你回去尝试将文本挖掘和图像识别应用到实验室笔记本时,就会变得一团糟,”Durvasula补充道。“这是非常脏的数据,因为我们不向化学家付费来管理数据。我们付钱给化学家制造化合物。“

随着更多专业人士进入生物制药领域,人工智能的使用将会增加,其背景将科学与数据结合起来。Schrödinger的高级副总裁兼首席生物医学科学家Karen Akinsanya博士指出,许多大学的双MD /博士和计算机编程/计算机科学课程的发展越来越多地影响着新一代药物发现科学家的教育。

“我们的人都是药物化学家和Python程序员。对于我们这些年龄较大的人来说,看看他们如何处理药物发现中的问题真的很吸引人。我认为随着时间的推移肯定会进一步探索,“Akinsanya说。

Boehringer Ingelheim心脏代谢疾病研究部门的首席科学家Paolo Guarnieri博士补充道,其他技术背景将有助于推动人工智能及相关技术发展所需的文化变革。

“他们在本体中思考”

“你可以看到新一代科学家,最年轻的科学家,他们带着电脑,”Guarnieri说。“他们描述一种现象的方式不同于一位言语更老的科学家。我可以看到他们在本体中思考。“

Durvasula说,实现文化变革将从改进所收集的数据开始,最终在科学本身:“我已经不再谈论人工智能了。我已经开始在Lilly谈论我们将如何组装杀死数据集,以回答将加速我们的管道的科学问题?

“当你把所有人聚焦在房间里时,无论是化学家,生物学家,临床医生,IT人员,数据科学家等,对杀手数据集,杀手数据集所需的科学问题,文化将开始分解一点,我们将了解我们如何到达该数据集。然后,我们使用AI的方式将得到改善。“

Flatiron Health是一家医疗保健技术和服务公司,其产品旨在为癌症护理提供商和生命科学公司提供支持,该公司致力于通过合作和合作伙伴关系改进其数据,其中大部分数据来自电子健康记录。Flatiron Health业务发展总监Sarah Kramarz表示,该公司与Foundation Medicine合作开发Clinico-Genomic Database,旨在帮助研究人员和生物制药加速靶向疗法的开发。

“在肿瘤学中 - 这可能与许多疾病类似 - 有趣的东西存在于非结构化数据中。因此,我们开发了一个从非结构化数据中提取临床见解的流程,“Kramarz说。“我们还充分认识到电子健康记录中不存在大量的信息,这些信息对于药物开发和发现以及在现实世界数据中找到见解非常重要。通过合作伙伴关系,我们找到了我们没有的信息来源,并且能够将我们的数据集与其他数据集进行排序。“

Clinico-Genomic Database于2016年推出,通过其全面的基因组分析分析将基因组的基因组分析数据链接起来,Flatiron的纵向数据详细介绍了临床治疗和结果。上个月,两家罗氏子公司在美国医学协会杂志上发表了一项研究,该研究提供了验证,即从常规临床护理中获得的真实数据,以生成多机构临床基因组数据库是可行的,并且可以产生新的,具有临床意义的见解。

该研究“使用临床基因组学数据库对患者特征和肿瘤基因组学与非小细胞肺癌患者的临床结果相关联”得出结论,该数据不仅可以作为推动肿瘤学研究和发现的现实证据,但也可以最终告知临床指南。

Flatiron在全国范围内通过280多项社区肿瘤学实践,通过其技术解决方案提供了220万活跃的患者记录。Kramarz说,Flatiron面临的一个持续挑战是,当临床医生蜷缩一段时间时,会产生临床医生的数据,每天看到数十名患者。

“溢出的咖啡渍”

“我们在业务提供商方面的激励措施是减少您在EMR上花费的时间,然后我们在业务研究方面的激励措施是尽可能地获取结构化数据。这两个总是不一致,“Kramarz承认。“作为患者和医生,我们已经把我们的头号优先考虑在内,因此我们将努力工作,并在后端需要做些什么。但是我们得到的90%都是由此决定的。这是一张带有溢出的咖啡渍的扫描文件。这就是现实,因为这就是我们的医生有时间做的事情。“

Regeneron Pharmaceuticals与GSK合作成功地将大规模基因组分析与生物样本数据审查相结合,以发现人群中罕见的,新颖的和临床可操作的基因变异。该研究小组从英国生物银行获得了来自超过500,000人的遗传和表型数据库,该团队选择了49,960个个体,并在超过39兆碱基的基因组中进行了全外显子组测序(WES),包括19,396个常染色体和82个性染色体基因。

Regeneron统计遗传学主任Manuel Ferreira博士表示,考虑到每位患者捕获的数千张图像,机器学习和人工智能可以帮助研究人员将脑图像与临床和遗传数据相结合。“对我来说,这是关于找到我们现有的瓶颈。其中哪些可能会被AI修复?它只是务实:有一个工具。有一个问题。他们匹配吗?“

Eli Lilly的Durvasula表示,随着公司解决AI瓶颈问题,他们将能够最好地将这些技术整合到他们的药物发现和开发工作中。

“我希望在接下来的十年中,我们将转向计算优先的研究环境,一个模型优先的研究环境,而不是尽可能多地运行这些实验,然后进行建模和计算刚刚发生了什么,“Durvasula说。“它必须是计算优先或模型优先的研究环境。这需要将所有技能集中在房间里的所有人,甚至是所有多领域技能,甚至是共同目标,共同的科学问题。“

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容