AI Navigator 2026

具身智能与 Agent

过去 70 年 AI 一直被困在屏幕里——能回答你的问题，但帮不了你订机票、搬箱子、做饭。直到 2023 年 AutoGPT、2024 年 Computer Use、2024 年 Figure 02，AI 才终于学会"自己用电脑"和"附身机器人"。

从"会聊天的盒子"到"会动手的 AI"

让 AI 走出聊天框、真正"做事"——无论是在数字世界 (用电脑) 还是物理世界 (机器人)，都是比"理解语言"更难的圣杯。

【1960s-1990s · 专家系统时代】最早研究者用"if-then"规则编码人类专家的知识。MYCIN 给医生提供诊断建议，但规则只能覆盖已知场景，遇到新问题就懵。同时机器人控制走的是另一条路：精确建模 + PID 控制，能造出工业机械臂，但不会"思考"。

【2013-2017 · 强化学习起飞】DeepMind 用深度强化学习 (Deep RL) 让 AI 自己玩 Atari 游戏到超越人类，AlphaGo 击败李世石。AI 学会了"试错 + 奖励"——但只在限定游戏环境里。

【2018-2022 · LangChain 与 ReAct 范式】研究者发现：让 LLM 调用工具 (搜索、代码、计算器) 能极大扩展能力。ReAct 论文提出"思考 → 行动 → 观察 → 再思考"的循环，LangChain 把这套打包成开发框架。AI 开始有了"小手"。

【2023.04 · AutoGPT 引爆】一个开源项目让大模型"自己定计划、自己执行、自己改错"。一周内 GitHub 涨星 10 万。全网第一次看到 AI Agent 的雏形——虽然 90% 的任务它会失败。

【2024.03 · Figure 01 接入 ChatGPT】Figure AI 公司展示视频：人形机器人接入 ChatGPT 大脑，边干活边和人类流利对话。"具身智能"概念从论文走向产线。

【2024.10 · Computer Use 突破】Anthropic 发布 Computer Use，Claude 学会像人一样接管屏幕、操作鼠标、填表格、点按钮。AI 突破 API 边界，可以用任何软件。

【2024-2025 · VLA 模型崛起】视觉-语言-动作模型 (VLA) 把视觉感知、语言理解、机器人动作统一到一个端到端模型。RT-2、OpenVLA、π0 让机器人能听懂"把碗搬到水池"这种自然语言并执行。

【2025-2026 · 软硬件全面 Agent 化】Tesla Optimus、Figure、宇树进入工厂量产。数字世界里，Manus、Devin 等系统级 Agent 成为"超级外包"——它能自己读文档、写代码、跑测试、修 bug。

【今天】AI 不再只活在聊天框里。一边它学会用电脑像人一样办公，一边附身在真实机器人里干活。这是过去 70 年 AI 史上最大的形态跃迁。

AI 厂商图谱

Manus

Agent 新锐

Manus：全能系统级 Agent，闭源

Cognition (Devin)

AI 程序员

Devin：自主 AI 软件工程师，闭源

智谱 AutoGLM

国产大厂

AutoGLM：手机/PC 智能体，闭源

Figure AI

机器人独角兽

Figure 02：双足人形机器人，闭源

Tesla

制造业巨头

Optimus Gen 3：量产型人形机器人，闭源

Boston Dynamics

老牌霸主

Atlas (Electric)：全电动高动态机器人，闭源

智元机器人 (AgiBot)

国产明星

远征 A2：交互型服务机器人，闭源

Skild AI

通用大脑

Skild Brain：通用机器人大脑，闭源

Unitree 宇树

国产机器人

Unitree G1：极致性价比人形机器人，闭源

技术演进时间线

1972 MYCIN 专家系统：斯坦福开发的医学诊断系统，靠 600 多条人手写规则给医生建议。是早期 AI Agent 的雏形——但只能覆盖已知场景。
2013 深度强化学习起飞：DeepMind 用 Deep Q-Network 让 AI 自学玩 Atari 游戏到超越人类。AI 学会了"试错 → 奖励"——但仅限游戏环境。
2016 AlphaGo 击败李世石：强化学习 + 蒙特卡洛树搜索 + 自我对弈。AI 第一次在最复杂的人类智力游戏上完胜世界冠军。
2022 ReAct 范式与 LangChain：研究者发现让 LLM 调用工具 (搜索、代码) 能极大扩展能力。ReAct 论文提出"思考-行动-观察"循环，LangChain 把这套打包给开发者。AI 有了"小手"。
2023.04 AutoGPT 全网爆火：一个开源项目让大模型"自己定计划、自己执行、自己改错"。一周 GitHub 涨星 10 万。全网第一次看到 Agent 雏形——虽然 90% 任务会失败。
2024.03 Figure 01 接入 ChatGPT：Figure AI 视频展示：人形机器人接入 ChatGPT 大脑，边干活边和人类流利对话。"具身智能"从论文走向产线。
2024.10 Computer Use 突破：Anthropic 发布 Computer Use，Claude 学会像人一样接管屏幕、操作鼠标、填表格。AI 突破 API 边界，能用任何软件。
2024-2025 VLA 模型崛起：RT-2、OpenVLA、π0 把视觉、语言、机器人动作统一到一个端到端模型。机器人开始能听懂"把碗搬到水池"这类自然语言。
2025 人形机器人进工厂：Figure 02 在 BMW 工厂上岗，Tesla Optimus 量产线启动，Unitree G1 进入科研机构。"数字大脑掌控物理躯体"成为现实。
2026 系统级 Agent 与 AGI 前夜：Manus、Devin 等"超级软件工程师"能自己读文档、写代码、跑测试、修 bug。完全自主的长程任务 AI 进入千行百业。