孙富春：《具身智能赋能产业发展》-名家讲堂

孙富春：《具身智能赋能产业发展》

2025-12-18 13:16:20

演讲人：孙富春（清华大学计算机科学与技术系教授，博士生导师）

近日，清华大学计算机科学与技术系教授、中国人工智能学会副理事长孙富春应邀出席2026中国人工智能大会并发表《具身智能赋能产业发展》的主题演讲。
他说，离身智能体不具备物理形态，被动接受人类采集制作好的数据，停留在‘纸上谈兵’，而具身智能是给机器一个物理的身体或形式来与物理世界交互（如家用服务机器人、无人车等）。1963年麻省理工学院Richard Held教授用一对猫做学习训练，一只猫放在篮子里并蒙上眼睛，另一只猫在物理世界自主行动，结果与物理世界进行感知与交互的猫学会了行走，这个例子进一步说明具身的重要性。”
然而，要实现真正的“智能”，具身智能系统需要具备场景感知、认知、多模态的连续学习等能力为机器人提供更为丰富和全面的环境理解能力。孙富春举例称：“人要做好一件事通常要将抽象的感知提升为认知，而认知最重要的承载是知识，把苹果放在桌子上可以分解为三步。首先，找苹果，这是感知技能加认知技能的结合，我们的大脑指挥颈部带动眼睛扫描；第二步，抓住苹果；第三步，放置苹果。在知识引导下，机器也会如同人一样迅速完成各类任务，并且可以根据操作对象的不同形态、大小、软硬来完成操作。不仅如此，具身智能还体现在智能体做多任务和跨任务方面。”
当前，具身智能的快速发展，为众多行业带来了前所未有的变革机遇。在制造业领域，具身智能机器人能够精准执行复杂的生产任务，提高生产效率和产品质量；在医疗领域，具身智能也展现出了巨大的应用潜力。例如，在外科手术中，医疗机器人可以辅助医生进行高精度的手术操作，降低了手术风险，提高了手术成功率。此外，具身智能还在智能家居、安防监控、智慧交通等领域发挥着重要作用。
展望具身智能的未来，孙富春提出，具身智能的发展将主要围绕四大核心要素展开：本体，具身智能体，数据、知识和场景以及学习和进化架构。
具体来看，本体作为实际的执行者，是在物理或者虚拟世界进行感知和任务执行的机构，具有广泛适应性的机器人本体是非常必要的。其次，具身智能体是具身于本体之上的智能体，负责感知、理解、决策、控制等核心工作，能够与环境进行自主交互是具身智能的核心。目前，具有通用能力的LLM（大语言模型）和VLM（视觉语言模型）等模型可以赋予具身智能体强大的泛化能力。第三，数据是泛化的关键，但涉及机器人的数据稀缺且昂贵。为了适应复杂环境和任务的泛化性，模型规模变得越来越大，而大规模的模型对于数据的要求更为严格。第四，真实物理环境的诸多方面目前往往难以模拟，如何对简单的仿真和复杂的真实世界进行有效的Sim2Real建模，也是智能体设计的关键。
嘉宾介绍：
孙富春：中国自动化学会会士，中国人工智能学会会士，电气与电子工程师协会会士，清华大学计算机科学与技术系教授，计算机科学与技术系学术委员会主席，智能技术与系统国家重点实验室副主任，国家杰出青年基金获得者、教育部新世纪优秀人才。兼任：国家重大研发计划机器人总体专家组成员，中国人工智能学会智能控制与智能管理专业委员会副主任兼秘书长，IEEE控制系统协会:智能控制技术委员会委员，Mechatronics、IEEE Trans. on Neural Networks、Soft Computing编委。孙富春主要研究领域为智能控制、机器人与飞行器的导航与控制，网络控制系统，人工认知系统的信息感知和处理。已主持多项国家自然科学基金、973项目、863项目和国防预研项目；在国际期刊发表论文58篇（SCI收录52篇），已申请受理发明专利8项、获得授权3项；专著《机械手神经网络稳定自适应控制的理论与方法》被高等教育出版社于2005年出版，专著《空间机器人学：动力学、规划与控制》即将被清华大学出版社出版，译著《机器人学导论》已为三十多所大学作为教材使用，获得好评。

邀请老师演讲、授课请致电：19821197419 阎老师[微信同号]
免责声明：以上内容（包括文字、图片、视频）为用户上传并发布，本平台仅提供信息存储服务。如涉及版权问题，请联系我们并提供版权证明，我们将立即删除！

上一文章：余斌：《立足4大优势积极识变、应变、求变》

下一文章：魏迎宁：《构建新时代保险业的新价值》

孙富春：《具身智能赋能产业发展》

嘉宾介绍：