眸深智能创始人穆泽林:对世界模型的感知是机器人完成动作的约束条件

7月3日-4日,2026亚布力论坛创新年会在上海市举行。本次创新年会的主题是“创新驱动 智启未来——十五五蓝图与企业机遇”。 上海眸深智能科技有限公司创始人穆泽林表示,现在行业有人觉得做机器人大脑视觉更重要,有人觉得触觉更重要,有人觉得力觉更重要。“但我们认为,无论是触觉、视觉看到的、感受到的一切信息,最终都是为了让机器人生成对应的动作。”他说。 他表示,机...

7月3日-4日,2026亚布力论坛创新年会在上海市举行。本次创新年会的主题是“创新驱动 智启未来——十五五蓝图与企业机遇”。 上海眸深智能科技有限公司创始人穆泽林表示,现在行业有人觉得做机器人大脑视觉更重要,有人觉得触觉更重要,有人觉得力觉更重要。“但我们认为,无论是触觉、视觉看到的、感受到的一切信息,最终都是为了让机器人生成对应的动作。”他说。 他表示,机器人和这个世界对话的唯一语言、和物理世界交互的唯一方式,就是通过自身动作对物理世界产生影响,再基于反馈完成下一步动作。 他介绍,过去五年,我们持续深耕迭代动作模型。无论是视觉模型、视频模型,我们始终认为,世界模型的感知,是机器人完成动作的约束条件。“这也是我们眸深智能在通用大脑领域最大的特点。我们深耕动作领域五年,最清晰、最透彻地掌握机器人动作排布逻辑,能够让机器人的动作更贴合物理场景,适配智能制造、家庭场景、轻工业等各类落地场景。”他说。

查看原文