为什么叫这个名字
Agent 原生的
通用人形基座模型
Agent · VLM · WBC —— 三层一体架构,
打通数字智能与物理智能的唯一路径。
具身智能的核心瓶颈——缺一颗大脑
硬件已较为成熟,但行业缺乏通用大脑,生态无法形成。
为什么?两条隐形的结构性裂缝。
数据没有真正 Scale 起来
LLM 靠互联网文本实现了 Scaling Law;
但具身智能的数据至今未真正 Scale ——
遥操作成本高、规模小,缺乏可规模化的数据引擎。
数字世界与物理世界研发割裂
Agent/大模型在数字世界飞速进化,
机器人在物理世界独立发展,二者几乎隔离。
但 Physical AGI = Digital AI + Physical AI。
核心团队 · Agent 驱动的AI-Native 公司
全栈覆盖大模型、Agent、运动小脑、机器人硬件 —— 10 人核心 + N 个 AI Agent,人均产出远超传统团队。
宋鸿涌
MetaBot · Agent-Native 组织基础设施
一套从数字世界延伸到物理世界的 Agent 框架 —— 这就是物理 AGI 的入口。
MetaMemory
Skill Hub
Agent Bus
T5T · Top 5 Things
为什么这是 壁垒
人均产出 ≈ 50 人规模
Agent 驱动的三层一体架构
MetaBot · Agent 层
ALWAYS-ONVLM · 视觉语言大脑
5–10 HzWBC · 运动小脑
50–500 Hz核心技术关键词
从底层方法到模型能力,四个关键词定义了 XVI 的大脑。
DreamVPT
Long Context
WholeBody VLA
In-Context RL
Compositional
Generalization
和大模型同一套打法 · Benchmark 驱动
我们做的是通用人形基础模型 —— 不是垂直场景方案。和 LLM 一样 scaling,像 LLM 一样刷榜。
业内每一个公开的人形 benchmark,从室内到室外、从操作到导航、从单步到长程 —— 我们都要刷到第一。通用能力用硬证据说话。
室内操作
室外移动
双手协作
长程任务
人机协作
泛化能力
通用之上 · 押注物理世界高价值场景
我们押注的是物理世界高价值场景 —— 人类去不了、不愿意去、不应该去的地方。
三个方向不是能力边界,是资源聚焦 —— 独家数据、独家场景、独家 benchmark,构成别人无法复制的 moat。
人形宇航员
机器人硬件工程师
机器人实验员
Claude 是通用 LLM · Anthropic 押注 coding · 刷到 SWE-bench 第一 · 诞生 Claude Code。
XVI 是通用人形基座 · 押注这三个方向 · 每一个做成 具身智能的 killer app。
通用是底盘 · taste 是壁垒 —— 两者不冲突,缺一不可。
模型领先 → 垂直整合
两阶段路径 —— Phase 1 极致聚焦模型层奠定 authority,Phase 2 启动硬件自研走向整机量产。先快后重,不分散精力。
技术验证
~100h 真机种子
核心 PoC 跑通
开源发布
模型开源 · arXiv 论文
对标 DeepSeek 路线
火星 Demo
In-Context RL 闭环
首次公开现场
模型 SOTA
10000h 数据
奠定 authority
10 人 all-in 模型
模型 + 论文全开源
benchmark 领跑
启动硬件自研
供应链布局
自研路线确立
GPT-4 时刻
整机原型 v1
行业临界点达成
整机量产
MARKET 01-03 自营 RaaS
数据飞轮启动
规模落地
高价值场景先,家用最后
价值链核心位
XVI 整机 RaaS 自营
自研整机 · 数据 own 100%
本体厂 API 授权
融资需求
以明确的资金配比,支撑从 PoC 到开源发布再到生态建设的完整节奏。