XVI Robotics XVI ROBOTICS 为什么叫这个名字
CONFIDENTIAL · SERIES ANGEL+ 2026
Agent-Native · Humanoid Foundation Model

Agent 原生
通用人形基座模型

Agent · VLM · WBC —— 三层一体架构,
打通数字智能物理智能的唯一路径。

FOUNDED
2025.12
TEAM
10 + N Agents
RAISE
$1520M
STAGE
Angel+
THE CORE BOTTLENECK · 问题

具身智能的核心瓶颈——缺一颗大脑

硬件已较为成熟,但行业缺乏通用大脑,生态无法形成。
为什么?两条隐形的结构性裂缝。

02 · PROBLEM
ISSUE 01 · DATA
01

数据没有真正 Scale 起来

LLM 靠互联网文本实现了 Scaling Law
但具身智能的数据至今未真正 Scale ——
遥操作成本高、规模小,缺乏可规模化的数据引擎。

COST/UNIT
HIGH
COVERAGE
LOW
SCALING LAW
N/A
ISSUE 02 · TWO WORLDS
02

数字世界与物理世界研发割裂

Agent/大模型在数字世界飞速进化,
机器人在物理世界独立发展,二者几乎隔离。
Physical AGI = Digital AI + Physical AI

DIGITAL
LLM · Agent
PHYSICAL
Robot · WBC
缺一颗打通数字世界物理世界的统一大脑。
CORE TEAM · AI-NATIVE COMPANY

核心团队 · Agent 驱动的AI-Native 公司

全栈覆盖大模型、Agent、运动小脑、机器人硬件 —— 10 人核心 + N 个 AI Agent,人均产出远超传统团队。

03 · TEAM
宋鸿涌 · Flood Sung
FOUNDER & CEO

宋鸿涌

FLOOD SUNG
前月之暗面(Moonshot AI)后训练 / 强化学习负责人,深度参与 K 系列大模型
验证 RLHF、长链推理、Agentic Task 训练,具备将 Transformer 作为大脑的核心认知
MetaBot 开发者 — 已验证 Agent-Native 组织范式
大模型 · Agent · 运动小脑 · 机器人硬件 全栈经验
CORE TEAM · 4 LEADS
04
VP
YH · 技术 VP — 前月之暗面后训练长文本负责人 / 字节 Seed 研究员
WBC
FHQ · 人形运控负责人 — 南大 PhD,Nature Communications
NAV
WZC · 人形导航 — 上海 AI Lab 博后,internvla-n1 核心作者
MANI
ZZA · loco-manipulation — 清华 master,Reinforce Dynamics 社区负责人
ORG MODEL · AGENT-NATIVE
10 + N
HUMAN + AGENTS
MetaBot 驱动的 Agent-Native 组织 —— 人均产出等效 ≈ 50 人规模。
METABOT · OPEN-SOURCE AI AGENT INFRA

MetaBot · Agent-Native 组织基础设施

一套从数字世界延伸到物理世界的 Agent 框架 —— 这就是物理 AGI 的入口。

04 · INFRA
github.com/xvirobotics/metabot
MODULE 01

MetaMemory

持久化知识库,Agent 共享记忆,组织知识自动沉淀。
MODULE 02

MetaSkill

Agent 工厂 —— 一键生成专业团队(研究员 / 工程师 / reviewer)。
MODULE 03

Agent Bus

多 Agent 协作总线,跨实例任务委派与实时协同。
MODULE 04

Scheduled Automation

Cron 定时任务 + 监督式自主执行 —— 7 × 24 无人值守。
WHY THIS IS THE MOAT

为什么这是 壁垒

01
同一套 Agent 框架,从数字世界延伸到物理世界 —— 这就是物理 AGI 的入口
02
组织本身就是产品的试验场 —— 每天在用 MetaBot 验证 Agent 调度、记忆、协作。
03
已开源 —— 构建开发者社区,抢占 Agent-for-Robotics 生态位。
10 + N
OUTPUT
人均产出 ≈ 50 人规模
THREE-LAYER UNIFIED STACK · 架构

Agent 驱动的三层一体架构

05 · ARCHITECTURE
L1
LAYER ONE

MetaBot · Agent 层

ALWAYS-ON
顶层调度,打通数字世界与物理世界
01Agent 顶层调度:任务规划 · 多步推理 · 错误恢复
02MetaMemory + MetaSkill + Agent Bus
03连接数字 / 物理世界的核心枢纽
04人类监督 + 自我进化闭环
L2
LAYER TWO

VLM · 视觉语言大脑

5–10 Hz
Humanoid Foundation Model · 感知与决策
01 视频预训练 → 后训练 → RL 类比 Computer Use Agent ↗
02核心组件:DreamVPT + IDM
03In-Context RL · 现场学习,快速适应新任务
L3
LAYER THREE

WBC · 运动小脑

50–500 Hz
Whole-Body Controller · 执行层
01控制全身 29 DOF + 灵巧手 22×2
02RL 仿真独立训练(Isaac Gym)
03带感知,适配不同地形
STACK OVERVIEW
数字智能 ⇋ 物理智能
L1 · AGENT MetaBot 数字世界 · Always-On L2 · VLM Visual-Language Brain 感知 + 决策 · 5–10 Hz L3 · WBC Whole-Body Control 物理世界 · 50–500 Hz
KEY INSIGHT
L2 和 L3 通过 latent space 连接 —— 决策与控制无缝衔接。
KEYWORDS · 核心技术

核心技术关键词

从底层方法到模型能力,四个关键词定义了 XVI 的大脑。

06 · CORE TECH
KEYWORD 01
/method

DreamVPT

合成视频 + 视觉预训练。让大脑在海量"做梦"的视频中学会物理直觉。
数据金字塔的颠覆 ↗
KEYWORD 02
/architecture

Long Context
WholeBody VLA

长上下文 · 视觉-语言-动作一体,覆盖全身与灵巧手的端到端策略。
KEYWORD 03
/learning

In-Context RL

现场学习,无需重训。在任务上下文中完成策略进化 —— 类 GPT 的 few-shot。
KEYWORD 04
/capability
VLM WBC ×

Compositional
Generalization

VLM × WBC 组合泛化 —— WBC 覆盖全身动作,VLM 感知理解世界,二者相乘即可做所有事
GENERAL FOUNDATION · 通用人形基础模型

和大模型同一套打法 · Benchmark 驱动

我们做的是通用人形基础模型 —— 不是垂直场景方案。和 LLM 一样 scaling,像 LLM 一样刷榜。
业内每一个公开的人形 benchmark,从室内到室外、从操作到导航、从单步到长程 —— 我们都要刷到第一。通用能力用硬证据说话。

07 · GENERAL
PUBLIC BENCHMARKS · 全量覆盖
DOMAIN 01

室内操作

家居 · 办公 · 实验室场景的抓取、放置与工具使用
DOMAIN 02

室外移动

复杂地形 · 动态环境 · 长距离自主导航
DOMAIN 03

双手协作

对称 / 非对称双手任务 · 装配 · 搬运 · 工具交接
DOMAIN 04

长程任务

多步骤规划 · 错误恢复 · 工具链调用
DOMAIN 05

人机协作

自然语言理解 · 协同作业 · 意图推断
DOMAIN 06

泛化能力

新物体 · 新场景 · zero-shot 迁移
通用基座是底盘 —— 每一个公开 benchmark 都是"我们能落地一切"的硬证据。不是 claim,是 leaderboard。
TASTE × MOAT · 重点押注

通用之上 · 押注物理世界高价值场景

我们押注的是物理世界高价值场景 —— 人类去不了、不愿意去、不应该去的地方。
三个方向不是能力边界,是资源聚焦 —— 独家数据、独家场景、独家 benchmark,构成别人无法复制的 moat。

08 · MARKET
PRIVATE BENCHMARKS · 独家场景
MARKET 01
PRIVATE BENCHMARK

人形宇航员

空间站巡检 · 月面/火星基地建设 · 科学载荷部署
COST ↓
1–2 orders
UPTIME
24 × 7
MARKET 02
PRIVATE BENCHMARK

机器人硬件工程师

机器人自主测试另一个机器人,替代人类硬件工程师
ITERATION
24 × 7
COST ↓
大幅
MARKET 03
PRIVATE BENCHMARK

机器人实验员

替代做物理实验的研究员,自主设计与执行实验
THROUGHPUT
10×
SAFETY
HIGH
ANALOGY · 先行者路径

Claude 是通用 LLM · Anthropic 押注 coding · 刷到 SWE-bench 第一 · 诞生 Claude Code

XVI 是通用人形基座 · 押注这三个方向 · 每一个做成 具身智能的 killer app

通用是底盘 · taste 是壁垒 —— 两者不冲突,缺一不可。

BUSINESS MODEL · 商业模式

卖大脑 API

向本体厂商提供 API,按调用收费

整体解决方案

采购本体 + XVI 大脑,RaaS 服务

数据飞轮

高价值场景稀缺数据反哺大脑,构筑壁垒
轻资产 + 模型 Scaling 能力建立标准 —— 占据具身智能价值链核心。
MILESTONES · 路线图

开源占生态位,定义行业标准

从 PoC 到具身 GPT-4 时刻 —— 节奏、里程碑与关键 Demo。

09 · ROADMAP
2026 · H1

技术验证

DreamVPT + IDM + WBC
核心 PoC 跑通
2026 · H2

开源发布

模型开源 · arXiv 论文
Demo 视频公开
2027

生态建设

开发者社区
本体厂商合作
2027 – 2028

技术突破

具身 GPT-4 时刻
行业临界点达成
KEY DEMO · 2026 Q4

火星模拟任务 · 乌兰察布

在火星模拟环境完整验证 自主导航 · 操作 · 决策In-Context RL 的闭环能力 —— 面向投资人与合作方的首次公开现场。
Q4
2026
THE RAISE · 融资需求

融资需求

以明确的资金配比,支撑从 PoC 到开源发布再到生态建设的完整节奏。

10 · FUNDING
ROUND · 天使加轮

Angel+ · Lead investor welcome

RAISE AMOUNT
$1520M
1 500 – 2 000 万美元
RUNWAY
18 – 24 MONTHS
MILESTONE
2026 Q4 DEMO
ALLOCATION · 资金用途
100%
COMPUTE · 40%
DATA · 30%
TEAM · 20%
HW · 10%
40%
COMPUTE

算力

GPU 集群租赁 —— 支撑大规模 RL 仿真与 VLM 训练
30%
DATA

数据

视频采集 · 标注 · 合成数据生成流水线
20%
TEAM

人员

核心团队招募 + 长期人才激励(ESOP)
10%
HARDWARE

机器人

采购人形本体及灵巧手,用于真机验证
CONTACT
floodsung@xvirobotics.com · xvirobotics.com
→ LET'S BUILD THE UNIFIED BRAIN