AI Navigator 2026

具身智能与 Agent

过去 70 年 AI 一直被困在屏幕里——能回答你的问题,但帮不了你订机票、搬箱子、做饭。直到 2023 年 AutoGPT、2024 年 Computer Use、2024 年 Figure 02,AI 才终于学会"自己用电脑"和"附身机器人"。

从"会聊天的盒子"到"会动手的 AI"

让 AI 走出聊天框、真正"做事"——无论是在数字世界 (用电脑) 还是物理世界 (机器人),都是比"理解语言"更难的圣杯。

【1960s-1990s · 专家系统时代】最早研究者用"if-then"规则编码人类专家的知识。MYCIN 给医生提供诊断建议,但规则只能覆盖已知场景,遇到新问题就懵。同时机器人控制走的是另一条路:精确建模 + PID 控制,能造出工业机械臂,但不会"思考"。

【2013-2017 · 强化学习起飞】DeepMind 用深度强化学习 (Deep RL) 让 AI 自己玩 Atari 游戏到超越人类,AlphaGo 击败李世石。AI 学会了"试错 + 奖励"——但只在限定游戏环境里。

【2018-2022 · LangChain 与 ReAct 范式】研究者发现:让 LLM 调用工具 (搜索、代码、计算器) 能极大扩展能力。ReAct 论文提出"思考 → 行动 → 观察 → 再思考"的循环,LangChain 把这套打包成开发框架。AI 开始有了"小手"。

【2023.04 · AutoGPT 引爆】一个开源项目让大模型"自己定计划、自己执行、自己改错"。一周内 GitHub 涨星 10 万。全网第一次看到 AI Agent 的雏形——虽然 90% 的任务它会失败。

【2024.03 · Figure 01 接入 ChatGPT】Figure AI 公司展示视频:人形机器人接入 ChatGPT 大脑,边干活边和人类流利对话。"具身智能"概念从论文走向产线。

【2024.10 · Computer Use 突破】Anthropic 发布 Computer Use,Claude 学会像人一样接管屏幕、操作鼠标、填表格、点按钮。AI 突破 API 边界,可以用任何软件。

【2024-2025 · VLA 模型崛起】视觉-语言-动作模型 (VLA) 把视觉感知、语言理解、机器人动作统一到一个端到端模型。RT-2、OpenVLA、π0 让机器人能听懂"把碗搬到水池"这种自然语言并执行。

【2025-2026 · 软硬件全面 Agent 化】Tesla Optimus、Figure、宇树进入工厂量产。数字世界里,Manus、Devin 等系统级 Agent 成为"超级外包"——它能自己读文档、写代码、跑测试、修 bug。

【今天】AI 不再只活在聊天框里。一边它学会用电脑像人一样办公,一边附身在真实机器人里干活。这是过去 70 年 AI 史上最大的形态跃迁。

AI 厂商图谱

Manus

Agent 新锐

  • Manus:全能系统级 Agent,闭源

Cognition (Devin)

AI 程序员

  • Devin:自主 AI 软件工程师,闭源

智谱 AutoGLM

国产大厂

  • AutoGLM:手机/PC 智能体,闭源

Figure AI

机器人独角兽

  • Figure 02:双足人形机器人,闭源

Tesla

制造业巨头

  • Optimus Gen 3:量产型人形机器人,闭源

Boston Dynamics

老牌霸主

  • Atlas (Electric):全电动高动态机器人,闭源

智元机器人 (AgiBot)

国产明星

  • 远征 A2:交互型服务机器人,闭源

Skild AI

通用大脑

  • Skild Brain:通用机器人大脑,闭源

Unitree 宇树

国产机器人

  • Unitree G1:极致性价比人形机器人,闭源

技术演进时间线

  1. 1972 MYCIN 专家系统:斯坦福开发的医学诊断系统,靠 600 多条人手写规则给医生建议。是早期 AI Agent 的雏形——但只能覆盖已知场景。
  2. 2013 深度强化学习起飞:DeepMind 用 Deep Q-Network 让 AI 自学玩 Atari 游戏到超越人类。AI 学会了"试错 → 奖励"——但仅限游戏环境。
  3. 2016 AlphaGo 击败李世石:强化学习 + 蒙特卡洛树搜索 + 自我对弈。AI 第一次在最复杂的人类智力游戏上完胜世界冠军。
  4. 2022 ReAct 范式与 LangChain:研究者发现让 LLM 调用工具 (搜索、代码) 能极大扩展能力。ReAct 论文提出"思考-行动-观察"循环,LangChain 把这套打包给开发者。AI 有了"小手"。
  5. 2023.04 AutoGPT 全网爆火:一个开源项目让大模型"自己定计划、自己执行、自己改错"。一周 GitHub 涨星 10 万。全网第一次看到 Agent 雏形——虽然 90% 任务会失败。
  6. 2024.03 Figure 01 接入 ChatGPT:Figure AI 视频展示:人形机器人接入 ChatGPT 大脑,边干活边和人类流利对话。"具身智能"从论文走向产线。
  7. 2024.10 Computer Use 突破:Anthropic 发布 Computer Use,Claude 学会像人一样接管屏幕、操作鼠标、填表格。AI 突破 API 边界,能用任何软件。
  8. 2024-2025 VLA 模型崛起:RT-2、OpenVLA、π0 把视觉、语言、机器人动作统一到一个端到端模型。机器人开始能听懂"把碗搬到水池"这类自然语言。
  9. 2025 人形机器人进工厂:Figure 02 在 BMW 工厂上岗,Tesla Optimus 量产线启动,Unitree G1 进入科研机构。"数字大脑掌控物理躯体"成为现实。
  10. 2026 系统级 Agent 与 AGI 前夜:Manus、Devin 等"超级软件工程师"能自己读文档、写代码、跑测试、修 bug。完全自主的长程任务 AI 进入千行百业。