我的位置: 上观号 > 上海科技 > 文章详情

从“机器人时代的安卓”到智慧农田,让具身智能“上手干活”

转自:上海科技 2025-07-31 22:08:21

“在操作系统的帮助下,机器人不再只是机械臂和代码的集合,而是像人一样,能在真实世界中感知、决策、行动。”在2025世界人工智能大会生态论坛“具身智能:从科学走向产业的探索与创新”论坛上,上海具识智能董事长、哈尔滨工业大学计算学部教授李治军介绍,用户只需表达“想抓橙子”的意图,系统便能调用基于语义的工作流,自动组织所需动作。

“做机器人时代的安卓”

操作系统是什么?对智能手机来说,是Android或iOS;对机器人来说,是定义行为逻辑、协调感知与行动的“神经中枢”。论坛上发布的全国首个“具身智能操作系统”InsightOS正是在这样的定位下诞生:不是“适配”机器人,而是“定义”机器人。

该系统来自上海具识智能科技有限公司自主研发的通用具身智能操作系统。该公司是长三角国家技术创新中心支持的重大项目公司。系统采用模块化架构,围绕“感知、决策、适配、协同”构建起“四维能力体系”,真正实现了机器人在陌生环境中的独立感知、自主规划和协同执行。

“我们要做机器人时代的安卓。”李治军说。“我们期待机器人和操作系统的深度融合,真正带来场景智能。”

更重要的是,InsightOS不仅是一个技术样品,更是已在上海本地落地的产业产品。上海具识智能科技有限公司已落户浦东张江科学城,已在智能制造产线、职业教育实训场景、智慧农业应用及服务机器人部署等领域“上手干活”。

“机器人进入具体场景,是全球产业化的最大瓶颈问题。”李治军说,“我们的目标是让新应用的开发周期从10人/月缩短到3人/天。”

在演示环节,具识团队展示了从语义任务配置,到仿真调试,再到真机部署的完整流程:用户选择预制场景,进行语义化流程编排,系统可在几分钟内完成从仿真到真机上线的过渡,并实时可视化任务执行状态,真正实现“即构即用”。“这套操作系统的使命,是帮助机器人真正‘下场’。”李治军说。

智能扎根农田:

多模态感知重塑农业图景

如果说操作系统是具身智能走向产业的“神经中枢”,那么农业便是其感知、行动和价值落地的绝佳土壤。论坛上,中国工程院外籍院士张建伟将视野拉至被誉为“AI蓝海”的智慧农业

张建伟看来,AI从数字世界走向物理空间的关键一步,正体现在“具身智能”对农业环节的重塑上——从视觉、听觉到触觉,从监测、物流到采摘、剪枝,机器人与农田的交互正变得更智能、更精准、更持久。

他列举了一个案例:为了提高对易损水果(如水蜜桃、草莓)的采摘精度,研究团队设计了一种模仿大象鼻子的气动柔性夹爪,结合高速触觉反馈系统,使机器人在不损伤果实的前提下完成采摘任务。这一设计,融合了材料科学、机械结构与感知算法的多学科协同,“具身智能不仅是‘像人一样动’,更是‘像人一样感’。”

多模态融合是实现“类人感知”的关键。“农业是物理世界中最复杂、最脆弱的场景之一,必须通过视觉、听觉、力觉的融合来精准判断作物状态。”他提到,在欧盟、中美等国家,农业机器人正以年均20%以上的增速扩张,而中国在这一领域的落地也已显现雏形。在崇明岛、张江及长三角一体化区域内,多个智慧农业项目正在开展中试与产业化探索,覆盖从环境监测到果蔬分拣、除草、病虫害识别等多个环节。

与产业结合的深度,也意味着技术架构需“顶天立地”:顶层需连接大模型支持的智能规划,底层则需稳定可靠的执行系统。这时,像InsightOS这样的系统性平台,便成为多模态感知、实时规划、快速部署的连接桥梁。“智能系统不是简单将AI算法装进机器人,而是让算法与环境真正耦合。”张建伟指出,这正是具身智能区别于传统人工智能的本质所在。

人形机器人正完成“从能动到能用”的跃迁。而上海,正成为这些企业的重点布局地。机器人“未来可以下田采茶,也能在家扫地刷碗。”

从软硬件深度融合,到高维语义感知,再到生态闭环建设,张建伟认为,农业将是具身智能技术落地最具广度和深度的场景之一。而背后的科研挑战——从世界模型构建到多模态数据训练、从语义控制到灵巧操作——则将推动新一轮AI+机器人基础研究突破。

这既是一场由底层驱动的技术革命,也是一场回应人类生活痛点的现实跃迁。“未来的机器人不只是‘更像人’,更是‘更懂人’。”张建伟说。

“上海科技”出品,转载请注明来源

企业及专家观点不代表官方立场

作者:蓝悦

↓分享

↓点赞

↓在看