聪慧网-聪慧过人( 六 )



望石智慧:用AI应用助力药物研发接下来简单介绍一下望石智慧在AI方面的应用, 主要是分为两个方面:分子设计和知识图谱 。
分子设计方面, 我们从靶研究开始, 一直到生成PCC分子, 整个流程中都有很好的工具和平台, 在一些项目发挥了亮眼作用 。

聪慧网-聪慧过人

文章插图
从上往下简单看, 例如靶点发现能力和protein 3D构象分析能力, 我们结合诸如MD Analysis的传统方法, 也用时空领域AI建模方式去做一些困难发现工作 。
例如分子设计方面, 有一些分子跃迁、分子衍生, 以及first-in-class基于口袋生成方法和超高通量筛选平台 。
同时, 我们在 FEP和超高通量筛选之间也构建了, 超出传统对接软件的scoring model, 进行进一步筛选 。
从HIT到Lead阶段, 我们更多借助QM/FEP工具, 也会用ADMET的模型反向进行强化学习, 以期对分子结构进行优化, 基本每一个流程都会有一些不错的工具 。

聪慧网-聪慧过人

文章插图
接下来介绍知识图谱方面, 望石在知识图谱有持续进展, 累积到目前挖掘了大量文献数据、结构和活性数据, 以及ADMET性质数据 。
我们构建了这样一张以化合物靶点生物过程为核心的知识图谱网络, 可以基于此, 进行生物通路、疾病机制探索, 也可以提取一些化合物结构和性质进行基于母核和取代基的活性分析 。

挑战与展望:AI+药物研发的三大问题最后谈一下个人对药物研发面临一些挑战和展望 。 大概分这三个方面:泛化性、准确率、数据稀疏 。

聪慧网-聪慧过人

文章插图
数据稀疏问题要分领域, 因为生物领域是一个非常大的领域, 面临问题非常多 。
所以有些点上数据比较多, 有些点上数据比较少, 例如一些ADMET性质非常多, 性质种类非常多, 但有些性质数据非常稀疏 。
泛化性问题也是比较严重的问题, 很多AI模型, 例如预测活性模型, 在发表的paper中经常介绍它比传统方法胜出多少, 但实际泛化性是受到质疑的, 因为评估级往往存在数据信息泄露问题 。
最后, 准确率问题, 有些活性数据测试实验条件不一样, 会导致同一个靶点、同一个化合物活性数据测试结果偏差较大 。
这是从数据角度出发, 模型表达能力也需要不断优化和改进 。
那是否有好的方面呢, 我从很实际的角度简单展望一下 。
一方面, 随着 AI在各个行业发展, 它的算力得到极大提升;另外, 生物制药领域经过多年积累, 数据也有相当丰富积累 。
例如, 随着基因工程蛋白序列技术发展, 我们积累了大量蛋白序列、多组学数据等, 以及人类目前已经有百亿级分子库, 这些分子对高通量筛选、分子生成都有重要推进作用 。
目前, AI领域也验证了一些大规模模型成功, 去年就已经有很好结果展现出来, Alphafold 2便是一个里程碑式事件 。

聪慧网-聪慧过人

文章插图

问答环节Q:深度学习docking跟传统的docking软件相比, 有什么优势?
周文彪:深度学习docking, 我们更多从概率论角度出发, 能更好地把口袋接触一些柔性小分子构象变化刻画出来, 当然更多也会考虑把蛋白质侧链甚至是蛋白质口袋变化融合进来, 这也是传统对接软件一个比较大的难点 。
另外, 我们也通过深度学习方法, 能够更全面刻画一些口袋内的弱相互作用, 以及形状契合方面问题 。


以上关于本文的内容,仅作参考!温馨提示:如遇专业性较强的问题(如:疾病、健康、理财等),还请咨询专业人士给予相关指导!

「辽宁龙网」www.liaoninglong.com小编还为您精选了以下内容,希望对您有所帮助: