我的位置: 上观号 > 上海三农 > 文章详情

从国内首位“AI作物科学家”问世,看人工智能赋能种业创新的“上海智慧”

转自:上海三农 2025-09-01 18:05:38

作物科学领域的“AI科学家”已经出现。

今年7月,2025世界人工智能大会接近尾声时,一则消息引起广泛关注:国内首位AI作物科学家“丰登·基因科学家”(GeneScientist)正式亮相。这是上海人工智能实验室联合崖州湾国家实验室、中国农业大学等单位推出的阶段性创新成果。据公开消息看,这款智能体也是全球首个基于大模型的作物育种科研智能体。

目前,这款智能体不仅具备自主开展作物基因研究的功能,且已经辅助发现了数十个此前未被报导的作物基因功能,并获得实验证实。

今后,在大模型智能体辅助下开展作物基因研究,或将成为常态。随着“丰登”系列迭代升级,不仅可以缩短育种周期,降低育种成本,未来,还有望实现育种研究的智能自主决策。

全文共2213字,阅读大约需要7分钟

作者 | 贾佳

编辑 | 黄倩欣

01

“丰登”能做什么?

“丰登”系列项目联合负责人、上海人工智能实验室青年科学家董楠卿介绍,“丰登·基因科学家”表现突出的科研能力有三类:知识总结归纳能力、基因-性状关联预测能力,以及实验推理与设计优化能力。“它能够自动整合国内外作物研究领域98%以上相关文献,构建‘基因-性状-环境’关联图谱,并按照关联性预测,提供相关研究方案的路线规划。”而支撑该智能体具备这些科研能力的,是国内首个种业大模型“丰登·大语言模型”(SeedLLM)。

2024年4月,“丰登·大语言模型”诞生,意味着国内种业大语言模型从“0”到“1”的突破。大模型经由海量专业数据训练而成,其语料涵盖国内外已公开发表的相关文献,涉及作物学、农学、遗传学等领域,并整合了生物学、气象学、土壤学等多学科交叉领域,还包括专业著作、实验数据、产业报告等。

“丰登·大语言模型”推出后,联合研发团队组织了326名领域专家开展了国际上首次在种业领域对人工智能大模型的标准化评估评测。经领域专家的系统性评测,“丰登”被确认,具备在品种选育、农艺性状、栽培技术和推广区域等四大核心领域的解释和回答能力,能够做到对高度分散状态下相关知识的融会贯通,能够自主挖掘复杂关联,并形成新的知识结构。

“丰登·大语言模型”问世至今,国内外已有超500家育种单位申请试用,包括隆平高科、中国科学院、中国农业科学院、中国农业大学等国内企业、科研院所及高校,也包括国际水稻研究所(IRRI)、印度中央水稻研究所(CRRI)等国际权威育种机构。

02

大模型开辟育种新路径

当下,基因编辑、合成生物学等革命性生物技术,正将作物基因功能及性状改良研究带向新的阶段。相比“直接改写”DNA、染色体或代谢网络等,大模型育种是通过大数据驱动,优化育种决策。当这些新兴技术相互融合,曾经长期依赖于人类经验积累的传统范式,有望被彻底打破。

随着“丰登·基因科学家”的出现,一条关于大模型辅助分子设计育种的技术路径正逐渐明晰。目前,崖州湾国家实验室的科学家利用该工具,在水稻和玉米中成功解析了数十个此前未被报道的作物基因功能。这些新发现为未来品种改良和分子育种提供了重要的理论基础。

“丰登”系列联合负责人、崖州湾国家实验室青年科学家杨帆介绍,作物育种的核心,在于通过精准改造基因组,以优化农艺性状。“要实现这样的目标,就必须系统性地深入理解基因与性状的关系,尤其要明确基因是通过何种分子机制来调控性状的形成。而传统研究只依赖于人为经验的育种方式,难以实现系统性发现。”杨帆说。

大语言模型技术恰恰在于以系统性优势,解决传统经验育种的短板。“大模型能充分发挥在数据汇聚与推理方面的优势,展现出高通量的基因功能挖掘能力和系统化的科研路径建构能力。”董楠卿说。目前,联合研发团队已建立全球首个作物基因功能研究推理链数据库,汇聚海量“假设-实验-结论”标准格式的数据链条;该数据库已成为当前覆盖范围广、结构完备的作物基因研究数据资源之一。

正是根据“丰登·大语言模型”对全球文献的系统分析发现,目前仍有约90%的水稻基因功能尚未明确,而玉米、大豆等主要作物的未知功能基因比例更高。杨帆说:“这款AI研究工具的发布,将会使整个研究领域的专家受益。”今后,联合团队更长远的目标是,在大模型智能体驱动下,打造全流程智能化的生物育种体系,实现育种研究的智能自主决策。

03

“人工智能+现代农业”成果初现

种业大语言模型“丰登”计划启动于2023年。上海人工智能实验室、崖州湾国家实验室在科技部指导下,从国家战略出发,协同攻关破题AI育种技术。作为两所国家实验室的联合创新成果,“丰登”系列是对近期发布的《国务院关于深入实施“人工智能+”行动的意见》的积极响应,在落实“加快人工智能驱动育种体系创新”要求和全面参与农业科技创新体系化构建上,显现出一定的示范效应。

左:上海人工智能实验室青年科学家董楠卿;中:中国农业大学生物学院教授王喜庆;右:崖州湾国家实验室青年科学家杨帆

研发过程中,崖州湾国家实验室和中国农业大学作为合作方,提供了宝贵的育种数据。由此也看到,人工智能团队与农业科技团队在紧密合作中,正补足涉农科研机构在“大模型时代”的技术短板,实现了“1+1>2”的效果。

董楠卿博士毕业于牛津大学计算机科学系,起初,他对生物育种一无所知。历时半年,通过对国内育种科研单位和专家团队的走访调研,以及与合作方的深入沟通,最终确认在科研育种中存在的需求痛点,可以通过人工智能技术来破题。开展合作前,崖州湾国家实验室也早已未雨绸缪,为“想象中的大模型”着手面向全球范围的育种数据采集和信息整合。

“但从人工智能学习角度来看,植物科学相关数据,相比医学领域仍然要少得多。”董楠卿说,“今后,希望生物育种研究者都能够主动打破数据孤岛,共同推动基于大语言模型的共享与合作,实现数据输入与输出的良性循环。”

此外,“丰登”系列的出现,离不开上海优渥的人工智能生态环境。近两年,上海多项人工智能专项政策集中出台,“模速空间”和“超算中心”硬件建设加速。2025年世界人工智能大会数据显示,预计今年底,上海智算供给能力超100EFLOPS,各类“人工智能+”垂类模型加快落地,先天优势使然。

除了“大模型”支持下的生物育种创新,上海正在全面布局“人工智能+现代农业”新赛道,在人工智能赋能生物制造、设施农业和农业机器人等细分领域也取得了一定进展。综合优势之下,上海农业科技创新正迎来新高潮。