Kimi 的一体化,Manus 的分层

Kimi 的一体化,Manus 的分层

作者: 阮一峰
日期: 2026年1月29日
整理时间: 2026-02-03 15:48
来源: 群聊消息
整理人: AI助手


摘要

本文分析了Kimi发布K2.5旗舰模型及其Agent的战略意义,探讨了大模型公司与智能体开发的两种不同路径:Kimi的一体化路线 vs Manus的分层路线。文章还测试了K2.5 Agent的视觉编程功能,展示了其强大的网页还原能力。


一、Kimi K2.5 的突然发布

2026年1月29日,Kimi突然发布了旗舰模型 K2.5,事先没有一点风声。

在国内,Kimi是比较低调的公司,关注度相对不高,但其产品实力不容小觑:
- 半年前,K2模型一鸣惊人,得到很高的评价
- 公认属于全球第一梯队
- K2.5发布后立刻成为热门话题,登上黑客新闻、推特等平台

著名开发者 Simon Willison 当天就写了详细介绍。


二、K2.5 的实力表现

评测成绩

根据官方发布说明,K2.5的基本能力:
- 各方面比K2都有进步
- 评测跑分基本都是全球前三位,甚至第一名

根据 LMArena(现改名为 arena.ai)的榜单:
- 编码能力:所有开源模型的第一名
- 总榜:仅次于 Claude 和 Gemini

真正的亮点:Agent一体化

但这次最大的亮点其实不是模型本身,而是 Kimi 同时发布了一个基于这个模型的 Agent(智能体)

这意味着同时发布了两样东西:
1. K2.5 模型 - 底层模型
2. K2.5 Agent - 面向最终用户的网络应用

这是第一次有大模型公司将模型和Agent绑在一起发布。Kimi 走上了一体化的道路。


三、一体化 vs 分层:两种开发路线

概念解释

概念 说明
大模型 底层的处理引擎
Agent 面向用户的上层应用

两种开发模式

模式一:分层开发(Manus路线)

代表: Manus(被Meta高价收购)

特点:
- 使用 Anthropic 公司的 Claude 模型
- 在其上独立开发智能体
- 投入相对较少,小开发者也能参与

优势:
- 灵活性高
- 可以组合不同模型
- 创新空间大

模式二:一体化开发(Kimi路线)

代表: Kimi K2.5 Agent

特点:
- 大模型和Agent合在一起开发
- 由大模型公司自己来做

优势:
- 与操作系统深度融合
- 使用更顺滑
- 有利于扩大市场份额

类比理解

就像手机应用
- 分层(安卓) - 外部应用可以更好地满足用户需求
- 一体化(苹果) - 内置应用与系统融合更顺滑


四、K2.5 Agent 的核心功能

Kimi对Agent很重视,发布说明的大部分篇幅都介绍Agent功能。

常规功能

功能 说明
Kimi Office Agent 专家级的 Word、Excel、PowerPoint 文件生成
Kimi Code 对标 Claude Code 的命令行工具,专门用于代码生成
长程操作 一次性完成最多1500步的操作,对标 Manus

创新功能(首次出现)

1. 视觉编程

能力: 通过模型的视觉能力,理解图片和视频,进而用于编程。

应用场景:
- 上传设计稿 → 生成网页
- 上传网页视频 → 还原网站

测试结果1:动效生成
- 上传:橘猫玩球的Lottie动画视频
- 提示词:”视频里面的动画效果,一模一样地在网页上还原出来”
- 结果:使用Python生成了SVG动画文件
- 效果:尾巴、眼球、小球滚动动画正确还原

测试结果2:网站还原
- 上传:B站上的设计师网站视频
- 提示词:”把视频里面的网站还原出来”
- 结果:还原度非常高,几乎可以直接上线

2. 蜂群功能(Agent Swarm)

能力: 遇到复杂任务时,Agent内部会自动调用最多100个Agent,组成集群并发执行。

应用场景:
- 并发下载
- 并发生成
- 复杂任务分解并行处理


五、测试案例展示

测试环境

  1. 打开 Kimi 官网,K2.5 已上线可直接使用
  2. 切换到”智能体模式” K2.5 Agent

案例1:动画效果还原

原始素材: Lottie库做的橘猫玩球动画

处理过程:
1. 模型识别出这是橘猫玩球动画
2. 将动画每一帧截图分析
3. 使用Python生成SVG动画文件

结果评价:
- ✅ 尾巴、眼球、小球滚动效果正确还原
- ⚠️ 小猫主体由多个SVG形状拼接,做不到很像

案例2:网站还原

原始素材: B站设计师网站视频

处理过程:
1. 分析视频中的网页结构和设计
2. 生成对应的HTML/CSS代码
3. 还原交互效果和视觉样式

结果评价:
- ✅ 还原度非常高
- ✅ 几乎可以直接上线使用


六、战略分析

Kimi一体化路线的优势

  1. 用户体验 - Agent充分发挥底层模型能力,使用更方便
  2. 市场推广 - 通过Agent扩展用例,吸引更多用户
  3. 技术整合 - 模型与Agent深度优化,性能更好

竞争格局分析

维度 Manus(分层) Kimi(一体化)
模型依赖 美国模型Claude 自研开源模型
公司注册 海外 国内
卡脖子风险 存在 不存在
灵活性 相对较低
整合度

国际竞争视角

在当下国际竞争格局中,一体化还有一个额外优势:

  • Manus - 依赖美国模型,不得不在海外注册公司
  • Kimi - 底层模型自研且开源,不存在”卡脖子”风险

七、要点提炼

关键观点

  1. 模型与Agent的关系正在重塑 - 从分层走向一体化
  2. 视觉编程是重要突破 - 从文本理解扩展到视觉理解
  3. 蜂群功能代表新方向 - 多Agent协作处理复杂任务
  4. 技术自主具有战略意义 - 自研模型避免外部依赖

行业趋势

  • 大模型公司开始向一体化发展
  • Agent功能成为竞争焦点
  • 视觉能力成为新的技术制高点
  • 多Agent协作是下一个创新点

八、思考与启示

对开发者的启示

  1. 分层开发仍有空间 - 不是所有团队都能做底层模型
  2. 专注垂直领域 - 在特定场景做深做透
  3. 关注新兴能力 - 视觉编程、多Agent协作等新方向

对企业的启示

  1. 技术自主是长期竞争力 - 避免关键依赖
  2. 用户体验是关键 - 一体化体验更顺滑
  3. 快速迭代很重要 - Kimi的快速发布策略值得学习

相关资源

  • 原文作者: 阮一峰
  • 原文日期: 2026年1月29日
  • Kimi官网: https://kimi.moonshot.cn
  • K2.5发布说明: 官方技术文档
  • 参考榜单: LMArena (arena.ai)
  • 延伸阅读: Simon Willison 的技术博客

本文档由AI助手整理生成
最后更新:2026-02-03