我的位置: 上观号 > 上海科技 > 文章详情

武汉大学“好”团队:以“佛系”心态“玩转”AI药物筛选 | 上海国际计算生物学创新大赛

转自:上海科技 2024-09-14 08:49:53

团队介绍

PROFILE

团队名称:“好”团队 

名次:优胜奖

主要成员:李坤



武汉大学 

“好”团队 

计算机学院 

在读博士



“上海有丰富的计算生物学科研资源,期待能在上海合作落地。”武汉大学计算机学院博士生李坤说,在2023年上海国际计算生物学创新大赛的药物筛选AI算法“凌越”挑战赛中,他所在的“好”团队凭借其在活性分子挑选方面的丰富经验成功入围前十名。这一成就源于团队多年来在药物反应预测和靶点亲和度预测领域的技术积累和创新突破。

1

制胜关键

活性分子挑选的技术沉淀

尽管提交的是一个高度理论化的结果,但李坤对最终的实验结果既自信又“佛系”。“确实有些忐忑,因为这是一个完全理论性的模型。”李坤说,“但我们的方法在真实数据集上做过实验,验证了它在当前领域中的先进性。即使最终效果不尽如人意,我也相信我们的方法要优于很多普通的方法,所以还是很有自信的。

武汉大学“好”团队的研究领域集中在药物发现,尤其是在药物反应预测和药物-靶点亲和度预测方面具有显著优势。团队在比赛中使用了一种基于自然语言监督的对比学习框架,即CLDR(Contrastive Learning Drug Response Models from Natural Language Supervision )。


其创新之处在于,将数值数据转换为文本,并结合常识性数值知识图谱进行对比学习。这种技术实现了药物反应预测的高精度表现,使团队在众多参赛者中脱颖而出。

李坤解释说:“我们在活性分子挑选上有多年的经验积累,这是能够入围前十的关键因素。比赛中的很多队伍可能在相关领域的技术积累不够深厚,而我们多年来一直致力于解决这一领域的关键问题。正是这种长期的研究和技术沉淀,让我们在比赛中表现出色。”

2

计算生物学的“未来征途”

在李坤看来,计算生物学在未来十年的发展中,将面临许多重要机遇和挑战。“首先是解决泛化性问题。我们希望看到计算机领域逐渐增强对未知数据的泛化能力,使得模型在面对没有见过的样本时,也能够做出准确的预测和判断。”

诚然,这不仅仅是当前药物反应预测中的问题,也是未来计算生物学发展的关键挑战。

李坤认为,泛化问题是当前整个药物研发领域面临的最重要挑战之一。他进一步解释道:“这就是指我们在模型训练过程中,如何让模型能够有效应对未知的数据样本。在传统的机器学习过程中,模型通常在训练集和验证集上进行训练和验证,但是这种方法的一个缺陷在于,验证的药物分子很可能在训练数据集中已经出现过。这意味着模型实际上并没有经历过真正的挑战,即如何在遇到完全未知的分子时,仍然能做出准确预测。”


在谈到具体的研究方向时,李坤认为个性化医疗是计算生物学领域另一个值得期待的方向。“每个人的基因都是独特的,这意味着在未来的治疗过程中,应该有更多针对个体差异的个性化治疗方案。通过计算生物学的技术,我们可以更加精准地了解患者的基因特征,从而制定更具针对性的疗法。”


此外,药物副作用的优化也是该团队关注的重点。我们正在设计基于扩散模型的药物属性优化技术,希望随着技术不断进步,能够开发出更为精准、效果更佳的药物,同时减少不必要的副作用。这不仅是我们团队的目标,也是计算生物学领域正在追求的方向。李坤告诉记者。

3

从头研发药物分子:

更精准的药物预测

为了应对传统药物开发过程中成本高和周期长等问题,该团队开发了新一代人工智能小分子药物设计与研发平台“百生来”

李坤说:“我们的平台针对药物分子从头设计、零样本学习以及药物预测等方面展开研究,能够有效实现降本增效。在功能方面,我们聚焦药物生成、药物反应、药物靶点以及药物属性领域,分别提出了自己的解决方案。”

与现有的药物开发模型相比,“百生来”平台提供了面向任务的分子生成和高精度的虚拟筛选功能,同时还支持域外数据的筛选,即用户私有数据的筛选,使得平台的通用性更强。

该平台提出了一种新的测试方法,同时引入了常识性数值知识图谱来增强模型的数值表示能力。李坤解释说:“我们设计了一种域外的测试方法,专门针对泛化能力不足的问题。将不同的数值信息嵌入到一个连续空间中,我们的模型能够更好地应对回归任务,预测效果也更加精准。”

李坤补充道:“在药物发现过程中,我们不仅通过设计创新算法提升了泛化能力,还希望将这些技术转化为实际应用。我们的目标是在未来三年内,通过实验闭环的方式,推动这些研究成果的商业化落地。”

当被问及是否设想过这一方法能最终走向成药并应用于临床时,李坤坦言:“当然是设想过的。我们与武汉大学泰康医学院有合作,进行靶点的药物发现工作。目前来看,我们在茫茫药物分子库中进行筛选推荐,效果还是不错的,推荐20个类药分子中,至少有一个符合我们的预期,这比最先进的水平提高了10%到15%。


对于最终的决赛结果,李坤再次展现出一种独特的“自信且佛系”。他说:这次参赛不仅是为了争取一个名次,更是希望通过比赛与业内顶尖的科研机构和企业进行交流合作。我们希望借助‘百生来’平台,将人工智能药物研发技术推向新的高度,实现更快、更精准的药物发现。

本次2023上海国际计算生物学创新大赛由上海市生物医药科技产业促进中心主办,中国科学院上海药物研究所原创新药研究全国重点实验室、中国银行上海市分行、华为云计算技术有限公司、临港实验室、上海人工智能研究院、东方美谷企业集团股份有限公司、上海大宁资产经营(集团)有限公司联合主办,上海生物医药公共技术服务有限公司和上海市生物医药产业技术服务平台具体承办,活动也得到了上海皓元生物医药科技有限公司(MCE中国)协办支持。

“上海科技”出品,转载请注明来源

企业及专家观点不代表官方立场

作者:蓝悦


↓分享

↓点赞

↓在看