活动标题:迈向具身智能:从数字人到通用机器人
活动时间:2026/04/18 14:30-2026/04/18 16:30
主讲嘉宾:李秀,清华大学深圳国际研究生院教授,博士生导师
活动地点:深圳大学城图书馆四楼413报告厅
随着人工智能技术持续演进,并不断从数字世界走向物理世界,具身智能正成为全球科技竞争和产业变革中的前沿方向。2026年4月18日下午,清华大学深圳国际研究生院李秀教授应邀做客深圳大学城图书馆“大学城新论·名家讲座”。李教授围绕人工智能发展脉络、数字人研究进展和通用机器人的应用前景,系统梳理了人工智能从分析智能、生成智能迈向具身智能的发展逻辑,带领听众走近这一正在加速演进的技术领域。
李教授现任中国人工智能学会智能融合专业委员会秘书长、深圳市人工智能学会副理事长,长期从事人工智能、数据挖掘等方向研究,在国内外核心学术期刊和会议发表学术论文200余篇,Google Scholar引用量逾12000次,H指数为53,获授权发明专利40余项。2022年至2025年,她连续四年入选斯坦福大学全球前2%顶尖科学家榜单,并于2025年度入选全球前2%顶尖科学家终身科学影响力榜单。

一、从人工智能发展脉络看技术演进方向
讲座伊始,李教授从人工智能的基本概念谈起。她指出,公众对人工智能的理解并不一致,有人首先想到聊天机器人,有人想到智能体,也有人会直接联想到机器人本身。事实上,人工智能并非某项单一技术或某种具体产品,而是一门围绕人类认知、推理、决策与行动展开研究的综合性交叉学科。它既涉及计算机科学,也离不开自动化、数学、神经科学、心理学等多个领域的共同支撑。
围绕人工智能的发展历程,李教授从符号主义、连接主义和行为主义三条路径展开梳理。她介绍说,早期人工智能更强调规则、逻辑和知识表示,希望通过符号推理模拟人的思维过程;随后,随着神经网络和深度学习的发展,研究者开始更重视通过海量数据训练模型,让机器从样本中学习特征、识别规律;而当人工智能被放入更加开放的环境中,人们又进一步关注机器如何通过感知、反馈和交互实现持续学习,这也构成了后来强化学习以及智能体研究的重要基础。
在这一脉络下,人工智能经历了由推理、知识、学习到大模型的持续演进。其发展背后,既有算法思想的更新,也有算力条件和数据资源的支撑。近年来大模型和AIGC技术的快速发展,使人工智能从过去以分析判断为主,走向了能够生成文本、图片、音频、视频等多种内容的新阶段。机器不仅能够从已有数据中归纳规律,还能在此基础上完成新的内容生产。正是在这一阶段,数字人、文生图、文生视频、智能创作等应用不断涌现,也让公众更加直观地感受到人工智能正在改变内容生产方式和知识获取方式。

二、从数字人研究走向具身智能探索
在介绍完人工智能总体发展脉络后,李教授把重点转向数字人与具身智能的衔接关系。她指出,数字人的研究并不仅仅是让虚拟形象更逼真、更自然,更重要的是通过表情生成、姿态估计、动作建模、语音驱动和场景交互等技术,推动机器更深入地理解人的行为方式、动作规律和交互逻辑。近几年,随着生成模型、扩散模型和多模态技术的发展,数字人在表现力、可控性和真实感方面都取得了明显进展。
讲座中,李教授结合团队的研究工作,介绍了数字人在二维与三维生成、人体重建、动作生成、手势生成、舞蹈生成、人脸驱动以及与环境交互等方面的探索。她提到,团队长期关注数字人的动态生成和真实控制,不仅在人物表情、动作与语音的协调表达方面持续推进,还在民族舞蹈风格生成、长时动作生成和多人物交互等方向进行了深入研究。这些工作一方面服务于动画、文旅、数字传播等应用场景,另一方面也在为更复杂的人机交互打基础。
不过,李教授也明确指出,数字人技术再成熟,其主要活动空间依然是虚拟世界。它可以在屏幕中完成展示、讲述和表演,也可以通过建模实现较为自然的动作表达,但一旦真正进入现实环境,问题就会变得复杂得多。现实世界存在重力、摩擦、碰撞、材质差异、空间约束和持续变化的外部条件,机器如果缺乏对这些物理因素的理解,就难以稳定完成抓取、移动、协作和操作等任务。正因为如此,人工智能要迈向通用机器人,就不能只停留在生成内容和虚拟表达层面,而必须进一步发展为具身智能。所谓具身智能,就是让智能真正拥有能够感知、行动并与环境持续互动的身体,使其不只是会分析、会表达,还能在真实世界中完成任务。
李教授认为,具身智能代表着人工智能走出屏幕、走向现实的重要一步,也是人工智能发展从数字空间延伸到物理空间的关键转折。当前具身智能的研究已经不再局限于单一模块的改进,而是朝着多模态融合、端到端建模和大模型驱动的方向不断演进。视觉感知、语言理解、动作规划、强化学习和物理仿真等能力正在加速汇聚,推动机器人从执行单一任务,逐步走向完成多任务、理解复杂场景和适应动态环境。与此同时,数字人领域积累的大量动作数据、空间建模经验和生成技术,也有望反过来服务于具身智能训练,为现实机器人提供更丰富的数据和更低成本的试验环境。

三、从通用机器人前景审视现实挑战
围绕具身智能和通用机器人的未来发展,李教授并没有停留在技术想象层面,而是从算法、数据、算力和治理等多个方面,分析了这一领域当前面临的现实挑战。她指出,具身智能之所以备受关注,是因为它被视为通向通用机器人的重要路径;而它之所以推进艰难,也恰恰在于现实世界远比数字世界复杂得多。
首先,数据仍然是制约具身智能发展的关键瓶颈。与互联网文本和图像数据相比,机器人所需的操作数据采集成本更高,获取过程更复杂,且往往涉及动作轨迹、手眼协同、力觉反馈和环境变化等多重信息。现实场景中的操作任务种类繁多,不同人、不同空间、不同物体之间都存在差异,要让机器人像人一样在多样环境中灵活行动,就必须依赖大量高质量、多模态、可泛化的数据支持。
其次,机器人对系统实时性和稳定性的要求极高。很多现实任务需要机器人在极短时间内完成感知、判断和动作执行,这意味着模型不仅要具备理解能力,还要具备很强的实时响应能力。通用机器人不是简单把几个算法拼接起来就能完成的,它涉及感知、控制、执行、本体设计、传感器融合、运动规划等系统性问题,任何一个环节出现短板,都可能影响整体表现。
再次,安全、伦理和治理同样不能滞后。互动环节中,围绕机器人功能安全、法律规范、就业变化等问题,现场读者踊跃提问。李教授表示,机器人从诞生之初就应当服务于人,而不是脱离人的约束独立运行。随着具身智能不断发展,如何建立安全边界、伦理规范和治理机制,如何在技术推进的同时保障可控、可靠、可追溯,将成为这一领域必须同步面对的重要课题。对于公众普遍关注的就业问题,李教授认为,智能技术的发展确实会对部分重复性、程序化岗位带来冲击,但这并不意味着人类价值会被削弱。相反,越是在人工智能加速发展的时代,越需要人类强化创造力、审美能力、复杂判断能力、沟通能力和跨学科整合能力。机器可以承担一部分标准化工作,人类则应在更具创造性、更具情感理解和更高层次决策的方向上不断提升自身能力。
讲座最后,李教授表示,从数字人到具身智能,再到通用机器人,人工智能正在经历从理解世界到进入世界的重要跨越。这一进程不会轻易完成,也不可能在短时间内彻底成熟,但它已经展现出深刻改变生产方式、生活场景和社会形态的潜力。她鼓励青年学生积极关注这一前沿领域,在算法研究、系统开发、场景应用和技术治理等方面寻找自己的切入点,把个人学习成长融入国家科技发展与产业变革的大趋势中。

本场讲座内容前沿、案例丰富、讲述深入浅出,不仅帮助现场听众系统理解了具身智能与通用机器人的技术演进逻辑,也进一步拓展了公众对人工智能未来形态的认知视野。此次讲座在学术前沿与公共理解之间搭建起了一座沟通桥梁,也为读者进一步思考人工智能时代的人机关系与社会发展提供了有益启发。(通讯作者:杨月涓)




