Kimi 的一体化，Manus 的分层

2026-05-31 2026年01月 20250203-Kimi的一体化Manus的分层.md

Kimi 的一体化，Manus 的分层

作者： 阮一峰
日期： 2026年1月29日
整理时间： 2026-02-03 15:48
来源： 群聊消息
整理人： AI助手

摘要

本文分析了Kimi发布K2.5旗舰模型及其Agent的战略意义，探讨了大模型公司与智能体开发的两种不同路径：Kimi的一体化路线 vs Manus的分层路线。文章还测试了K2.5 Agent的视觉编程功能，展示了其强大的网页还原能力。

一、Kimi K2.5 的突然发布

2026年1月29日，Kimi突然发布了旗舰模型 K2.5，事先没有一点风声。

在国内，Kimi是比较低调的公司，关注度相对不高，但其产品实力不容小觑：
- 半年前，K2模型一鸣惊人，得到很高的评价
- 公认属于全球第一梯队
- K2.5发布后立刻成为热门话题，登上黑客新闻、推特等平台

著名开发者 Simon Willison 当天就写了详细介绍。

二、K2.5 的实力表现

评测成绩

根据官方发布说明，K2.5的基本能力：
- 各方面比K2都有进步
- 评测跑分基本都是全球前三位，甚至第一名

根据 LMArena（现改名为 arena.ai）的榜单：
- 编码能力：所有开源模型的第一名
- 总榜：仅次于 Claude 和 Gemini

真正的亮点：Agent一体化

但这次最大的亮点其实不是模型本身，而是 Kimi 同时发布了一个基于这个模型的 Agent（智能体）。

这意味着同时发布了两样东西：
1. K2.5 模型 - 底层模型
2. K2.5 Agent - 面向最终用户的网络应用

这是第一次有大模型公司将模型和Agent绑在一起发布。Kimi 走上了一体化的道路。

三、一体化 vs 分层：两种开发路线

概念解释

概念	说明
大模型	底层的处理引擎
Agent	面向用户的上层应用

两种开发模式

模式一：分层开发（Manus路线）

代表： Manus（被Meta高价收购）

特点：
- 使用 Anthropic 公司的 Claude 模型
- 在其上独立开发智能体
- 投入相对较少，小开发者也能参与

优势：
- 灵活性高
- 可以组合不同模型
- 创新空间大

模式二：一体化开发（Kimi路线）

代表： Kimi K2.5 Agent

特点：
- 大模型和Agent合在一起开发
- 由大模型公司自己来做

优势：
- 与操作系统深度融合
- 使用更顺滑
- 有利于扩大市场份额

类比理解

就像手机应用：
- 分层（安卓） - 外部应用可以更好地满足用户需求
- 一体化（苹果） - 内置应用与系统融合更顺滑

四、K2.5 Agent 的核心功能

Kimi对Agent很重视，发布说明的大部分篇幅都介绍Agent功能。

常规功能

功能	说明
Kimi Office Agent	专家级的 Word、Excel、PowerPoint 文件生成
Kimi Code	对标 Claude Code 的命令行工具，专门用于代码生成
长程操作	一次性完成最多1500步的操作，对标 Manus

创新功能（首次出现）

1. 视觉编程

能力： 通过模型的视觉能力，理解图片和视频，进而用于编程。

应用场景：
- 上传设计稿 → 生成网页
- 上传网页视频 → 还原网站

测试结果1：动效生成
- 上传：橘猫玩球的Lottie动画视频
- 提示词：”视频里面的动画效果，一模一样地在网页上还原出来”
- 结果：使用Python生成了SVG动画文件
- 效果：尾巴、眼球、小球滚动动画正确还原

测试结果2：网站还原
- 上传：B站上的设计师网站视频
- 提示词：”把视频里面的网站还原出来”
- 结果：还原度非常高，几乎可以直接上线

2. 蜂群功能（Agent Swarm）

能力： 遇到复杂任务时，Agent内部会自动调用最多100个Agent，组成集群并发执行。

应用场景：
- 并发下载
- 并发生成
- 复杂任务分解并行处理

五、测试案例展示

测试环境

打开 Kimi 官网，K2.5 已上线可直接使用
切换到”智能体模式” K2.5 Agent

案例1：动画效果还原

原始素材： Lottie库做的橘猫玩球动画

处理过程：
1. 模型识别出这是橘猫玩球动画
2. 将动画每一帧截图分析
3. 使用Python生成SVG动画文件

结果评价：
- ✅ 尾巴、眼球、小球滚动效果正确还原
- ⚠️ 小猫主体由多个SVG形状拼接，做不到很像

案例2：网站还原

原始素材： B站设计师网站视频

处理过程：
1. 分析视频中的网页结构和设计
2. 生成对应的HTML/CSS代码
3. 还原交互效果和视觉样式

结果评价：
- ✅ 还原度非常高
- ✅ 几乎可以直接上线使用

六、战略分析

Kimi一体化路线的优势

用户体验 - Agent充分发挥底层模型能力，使用更方便
市场推广 - 通过Agent扩展用例，吸引更多用户
技术整合 - 模型与Agent深度优化，性能更好

竞争格局分析

维度	Manus（分层）	Kimi（一体化）
模型依赖	美国模型Claude	自研开源模型
公司注册	海外	国内
卡脖子风险	存在	不存在
灵活性	高	相对较低
整合度	低	高

国际竞争视角

在当下国际竞争格局中，一体化还有一个额外优势：

Manus - 依赖美国模型，不得不在海外注册公司
Kimi - 底层模型自研且开源，不存在”卡脖子”风险

七、要点提炼

关键观点

模型与Agent的关系正在重塑 - 从分层走向一体化
视觉编程是重要突破 - 从文本理解扩展到视觉理解
蜂群功能代表新方向 - 多Agent协作处理复杂任务
技术自主具有战略意义 - 自研模型避免外部依赖

行业趋势

大模型公司开始向一体化发展
Agent功能成为竞争焦点
视觉能力成为新的技术制高点
多Agent协作是下一个创新点

八、思考与启示

对开发者的启示

分层开发仍有空间 - 不是所有团队都能做底层模型
专注垂直领域 - 在特定场景做深做透
关注新兴能力 - 视觉编程、多Agent协作等新方向

对企业的启示

技术自主是长期竞争力 - 避免关键依赖
用户体验是关键 - 一体化体验更顺滑
快速迭代很重要 - Kimi的快速发布策略值得学习

Kimi 的一体化，Manus 的分层

摘要

一、Kimi K2.5 的突然发布

二、K2.5 的实力表现

评测成绩

真正的亮点：Agent一体化

三、一体化 vs 分层：两种开发路线

概念解释

两种开发模式

模式一：分层开发（Manus路线）

模式二：一体化开发（Kimi路线）

类比理解

四、K2.5 Agent 的核心功能

常规功能

创新功能（首次出现）

1. 视觉编程

2. 蜂群功能（Agent Swarm）

五、测试案例展示

测试环境

案例1：动画效果还原

案例2：网站还原

六、战略分析

Kimi一体化路线的优势

竞争格局分析

国际竞争视角

七、要点提炼

关键观点

行业趋势

八、思考与启示

对开发者的启示

对企业的启示

相关资源