Kimi 的一体化,Manus 的分层
作者: 阮一峰
日期: 2026年1月29日
整理时间: 2026-02-03 15:48
来源: 群聊消息
整理人: AI助手
摘要
本文分析了Kimi发布K2.5旗舰模型及其Agent的战略意义,探讨了大模型公司与智能体开发的两种不同路径:Kimi的一体化路线 vs Manus的分层路线。文章还测试了K2.5 Agent的视觉编程功能,展示了其强大的网页还原能力。
一、Kimi K2.5 的突然发布
2026年1月29日,Kimi突然发布了旗舰模型 K2.5,事先没有一点风声。
在国内,Kimi是比较低调的公司,关注度相对不高,但其产品实力不容小觑:
- 半年前,K2模型一鸣惊人,得到很高的评价
- 公认属于全球第一梯队
- K2.5发布后立刻成为热门话题,登上黑客新闻、推特等平台
著名开发者 Simon Willison 当天就写了详细介绍。
二、K2.5 的实力表现
评测成绩
根据官方发布说明,K2.5的基本能力:
- 各方面比K2都有进步
- 评测跑分基本都是全球前三位,甚至第一名
根据 LMArena(现改名为 arena.ai)的榜单:
- 编码能力:所有开源模型的第一名
- 总榜:仅次于 Claude 和 Gemini
真正的亮点:Agent一体化
但这次最大的亮点其实不是模型本身,而是 Kimi 同时发布了一个基于这个模型的 Agent(智能体)。
这意味着同时发布了两样东西:
1. K2.5 模型 - 底层模型
2. K2.5 Agent - 面向最终用户的网络应用
这是第一次有大模型公司将模型和Agent绑在一起发布。Kimi 走上了一体化的道路。
三、一体化 vs 分层:两种开发路线
概念解释
| 概念 | 说明 |
|---|---|
| 大模型 | 底层的处理引擎 |
| Agent | 面向用户的上层应用 |
两种开发模式
模式一:分层开发(Manus路线)
代表: Manus(被Meta高价收购)
特点:
- 使用 Anthropic 公司的 Claude 模型
- 在其上独立开发智能体
- 投入相对较少,小开发者也能参与
优势:
- 灵活性高
- 可以组合不同模型
- 创新空间大
模式二:一体化开发(Kimi路线)
代表: Kimi K2.5 Agent
特点:
- 大模型和Agent合在一起开发
- 由大模型公司自己来做
优势:
- 与操作系统深度融合
- 使用更顺滑
- 有利于扩大市场份额
类比理解
就像手机应用:
- 分层(安卓) - 外部应用可以更好地满足用户需求
- 一体化(苹果) - 内置应用与系统融合更顺滑
四、K2.5 Agent 的核心功能
Kimi对Agent很重视,发布说明的大部分篇幅都介绍Agent功能。
常规功能
| 功能 | 说明 |
|---|---|
| Kimi Office Agent | 专家级的 Word、Excel、PowerPoint 文件生成 |
| Kimi Code | 对标 Claude Code 的命令行工具,专门用于代码生成 |
| 长程操作 | 一次性完成最多1500步的操作,对标 Manus |
创新功能(首次出现)
1. 视觉编程
能力: 通过模型的视觉能力,理解图片和视频,进而用于编程。
应用场景:
- 上传设计稿 → 生成网页
- 上传网页视频 → 还原网站
测试结果1:动效生成
- 上传:橘猫玩球的Lottie动画视频
- 提示词:”视频里面的动画效果,一模一样地在网页上还原出来”
- 结果:使用Python生成了SVG动画文件
- 效果:尾巴、眼球、小球滚动动画正确还原
测试结果2:网站还原
- 上传:B站上的设计师网站视频
- 提示词:”把视频里面的网站还原出来”
- 结果:还原度非常高,几乎可以直接上线
2. 蜂群功能(Agent Swarm)
能力: 遇到复杂任务时,Agent内部会自动调用最多100个Agent,组成集群并发执行。
应用场景:
- 并发下载
- 并发生成
- 复杂任务分解并行处理
五、测试案例展示
测试环境
- 打开 Kimi 官网,K2.5 已上线可直接使用
- 切换到”智能体模式” K2.5 Agent
案例1:动画效果还原
原始素材: Lottie库做的橘猫玩球动画
处理过程:
1. 模型识别出这是橘猫玩球动画
2. 将动画每一帧截图分析
3. 使用Python生成SVG动画文件
结果评价:
- ✅ 尾巴、眼球、小球滚动效果正确还原
- ⚠️ 小猫主体由多个SVG形状拼接,做不到很像
案例2:网站还原
原始素材: B站设计师网站视频
处理过程:
1. 分析视频中的网页结构和设计
2. 生成对应的HTML/CSS代码
3. 还原交互效果和视觉样式
结果评价:
- ✅ 还原度非常高
- ✅ 几乎可以直接上线使用
六、战略分析
Kimi一体化路线的优势
- 用户体验 - Agent充分发挥底层模型能力,使用更方便
- 市场推广 - 通过Agent扩展用例,吸引更多用户
- 技术整合 - 模型与Agent深度优化,性能更好
竞争格局分析
| 维度 | Manus(分层) | Kimi(一体化) |
|---|---|---|
| 模型依赖 | 美国模型Claude | 自研开源模型 |
| 公司注册 | 海外 | 国内 |
| 卡脖子风险 | 存在 | 不存在 |
| 灵活性 | 高 | 相对较低 |
| 整合度 | 低 | 高 |
国际竞争视角
在当下国际竞争格局中,一体化还有一个额外优势:
- Manus - 依赖美国模型,不得不在海外注册公司
- Kimi - 底层模型自研且开源,不存在”卡脖子”风险
七、要点提炼
关键观点
- 模型与Agent的关系正在重塑 - 从分层走向一体化
- 视觉编程是重要突破 - 从文本理解扩展到视觉理解
- 蜂群功能代表新方向 - 多Agent协作处理复杂任务
- 技术自主具有战略意义 - 自研模型避免外部依赖
行业趋势
- 大模型公司开始向一体化发展
- Agent功能成为竞争焦点
- 视觉能力成为新的技术制高点
- 多Agent协作是下一个创新点
八、思考与启示
对开发者的启示
- 分层开发仍有空间 - 不是所有团队都能做底层模型
- 专注垂直领域 - 在特定场景做深做透
- 关注新兴能力 - 视觉编程、多Agent协作等新方向
对企业的启示
- 技术自主是长期竞争力 - 避免关键依赖
- 用户体验是关键 - 一体化体验更顺滑
- 快速迭代很重要 - Kimi的快速发布策略值得学习
相关资源
- 原文作者: 阮一峰
- 原文日期: 2026年1月29日
- Kimi官网: https://kimi.moonshot.cn
- K2.5发布说明: 官方技术文档
- 参考榜单: LMArena (arena.ai)
- 延伸阅读: Simon Willison 的技术博客
本文档由AI助手整理生成
最后更新:2026-02-03