所有人都说模型训练完就不会变了——我们让它继续长

不是下载一个 AI 是养大一个

传统 AI 出厂即定型,对谁都一样。我们让模型在推理中持续学习、权重随你而变——云端 AI 见过十亿人,你的只见过你。

We don't sell tokens. We set them free.

具身智能的大脑

不是机器人的肢体,是它思考、记忆、学习的中枢

等机器人成熟、可穿戴普及、智能家居互联那一天——每一个产品都会需要这样一个大脑。云端 AI 永远到不了那里:网络会断、时延会高、订阅会停、数据回不来。具身智能必须把大脑装进本体。

记得住

跨时间、跨场景、跨设备的连续记忆。不是每次对话重来,不是从零认识你。

学得到

从真实交互里学习用户偏好、节奏、语境。不是出厂时锁死的能力曲线。

属于本体

装在设备里,不是云端租赁。换设备时,记忆跟着走,不是上传到别人那里。

We are not making another AI tool. We are making the brain.

断网的那一刻,机器人不该停止思考。

254
真实使用记录
30 天用户日常 dogfood
9
画像方向
从行为里抽取的偏好维度
92%
个性化判官评分
vs base 模型 33%, 不损基础能力
9B
iPhone 跑得稳
实际占用 5.5GB, Jetsam 边缘
5
协同仓库
算子 / 训练 / 推理 / SDK / App
0
字节上云
数据物理上从不离设备

研究

不是论文综述, 是为产品奠基的原创研究

查看全部研究
MLXLayerStream

按层流式卸载:在 8GB 边缘设备上运行 9B+ 大模型

通过从 NVMe 存储按层流式加载权重,使超出设备内存的模型能在 iPad 和 iPhone 上推理。

推测解码 × MoE

推测解码对混合专家模型有帮助吗?

306 次实验的实证研究,揭示了 MoE 模型的全新批量验证摊销机制。

Prism

消费级硬件上的跨域个人数据整合

在设备端整合财务、饮食、情绪和阅读数据,零数据泄漏。

与我们一起构建

我们正在寻找想要突破端侧 AI 边界的研究人员和工程师。