2024年诺贝尔化学奖颁给了在蛋白质结构预测和设计领域使用AI技术的科学家,再次引发了人们对于“AI赋能生命科学”的无限想象。“AI制药”“AI诊疗”等概念也日益火爆。那么,AI大模型的兴起对于生物医药的研究究竟有多大助推力?又会遇见哪些挑战?
日前,中国人民大学以“新时代中国公共政策创新与国家发展”为主题,在深圳举办中国人民大学深圳论坛2024系列活动。其中,在序幕论坛暨首届企业高质量发展宝安论坛上,深圳理工大学计算机科学与控制工程学院院长潘毅以《AI大模型赋能生物医药》为题进行了演讲。他表示,AI在加速新药研发进程、解决复杂的生物医药难题方面发挥着重要作用,但AI技术的应用目前仍面临技术门槛高、数据获取难度大以及监管难问题,需将人类知识与数据驱动的AI模型相结合,以推动AI在生物医药领域的成功落地。
“AI制药”“AI诊疗”已成现实
如果为您诊断并开出药方的“医生”是AI,您会接受吗?近年来,这样参与诊疗的AI大模型层出不穷,有的已经在部分医院落地。潘毅表示,随着科技的发展,AI大模型在疾病预测与诊断中的应用已初见成效。例如,OpenAI的ChatGPT能够根据患者的症状描述,提供初步的疾病诊断建议。研究表明,AI在某些疾病(如癌症)的诊断准确率已达到62%。然而,“AI在复杂疾病诊断中的表现仍有待提升”,潘毅说,特别是在处理细微症状变化时,AI的表现可能并不如人类敏锐。
除了疾病诊疗,药物研发是AI大模型的另一重要应用领域。潘毅表示,传统的药物研发周期长、成本高,且成功率低。通过深入分析海量生物医学数据(如小分子序列和蛋白质结构等),AI模型能够显著加速新药小分子的设计与药物筛选过程。例如,AI模型能够在数亿个小分子中识别出与特定靶点高度匹配的潜在药物候选,这一能力不仅极大地缩短了药物研发周期,同时也显著降低了研发成本。
此外,AI大模型在个性化医疗中的应用也备受关注。通过分析患者的基因组数据、生活习惯及病史,AI能够为患者提供个性化的治疗方案。潘毅举例说,基于AI的问答系统可以帮助患者了解自闭症的潜在致病基因,并提供相关的治疗建议。
仍面临较大技术挑战
尽管AI大模型在生物医药领域展现了巨大的应用潜力,但潘毅指出,其应用仍面临诸多技术挑战。
首先,大模型的训练需要极高的算力和数据支持,这对计算资源和数据质量提出了严格要求。潘毅表示,大模型的核心特征在于其庞大的参数规模。以GPT-3为例,其参数数量高达1750亿。参数是模型中的可调节变量,用于拟合数据中的复杂关系。参数数量的增加使得模型能够捕捉更细微的模式,从而提高其生成能力。然而,大模型的训练需要极高的算力和数据支持,AlphaGo和AlphaFold等模型的成功离不开大规模的计算资源和高质量的数据集。这无疑提升了大模型研发的成本。
其次,AI模型在处理复杂任务时容易出现“幻觉”(即生成不准确或无意义的内容),如何提高模型的准确性与可靠性仍是亟待解决的问题。潘毅表示,为解决这一问题,研究者提出了知识驱动的方法,即将人类知识(如知识图谱、领域专家经验)融入模型中。通过结合数据驱动与知识驱动,AI模型能够更高效地学习并生成更准确的内容。
不可忽视的是,AI在生物医药中的应用还涉及伦理与监管问题。例如,AI生成的诊断建议是否具有法律效力?如何确保AI模型在处理患者数据时的隐私保护?潘毅强调,这些问题需要政府、企业及学术界的共同努力,制定相应的法规与标准。
未来可在三方面发力
挑战与机遇并存,AI大模型在生物医药领域“大展拳脚”已成不可逆转之势。众多企业也追随这一潮流,纷纷在生物医药领域进行新一轮战略布局。那么,该从哪些方向发力,才能在日益激烈的“AI+生物医药”的竞争中突围?
潘毅对未来发展指明了三个方向:首先是垂直化应用,即针对特定领域(如癌症治疗、药物研发)开发专用模型,以提高模型的准确性与实用性;其次是提升模型的可解释性,使医生和患者能够理解AI生成的结果及其背后的逻辑;第三是发展低能耗技术,开发低能耗的AI模型,以降低其运行成本并提高可持续性。他说:“未来,通过垂直化应用、提升可解释性及开发低能耗技术,AI大模型有望在生物医药领域实现更广泛的应用与落地。”