MiniMax MMX-CLI:面向 AI Agent 的全模态命令行工具

来源:https://github.com/MiniMax-AI/cli
整理时间:2026-04-11
标签:#MiniMax #CLI工具 #AI Agent #全模态 #命令行 #MCP替代


一、项目概述

MMX-CLI 是 MiniMax 官方推出的全模态命令行工具,专为 AI Agent 打造

只需一个 CLI,就能在任意 Agent 或终端中生成:文字、图像、视频、语音和音乐。

GitHub: https://github.com/MiniMax-AI/cli
npm 包: mmx-cli


二、快速上手

安装

# 方式1:全局安装 CLI(终端使用)
npm install -g mmx-cli

# 方式2:作为 Skill 添加到 Agent(OpenClaw、Cursor、Claude Code 等)
npx skills add MiniMax-AI/cli -y -g

认证

# API Key 认证
mmx auth login --api-key sk-xxxxx

# OAuth 浏览器授权
mmx auth login

# 查看认证状态
mmx auth status

# 刷新 Token
mmx auth refresh

# 登出
mmx auth logout

环境要求


三、全模态能力一览

3.1 文本聊天

mmx text chat --message "写一个Python爬虫"

3.2 图像生成

mmx image "一只穿宇航服的猫" --n 3 --aspect-ratio 16:9

参数:
- --n:生成数量
- --aspect-ratio:宽高比(16:9、4:3、1:1 等)

3.3 视频生成(异步)

mmx video generate --prompt "海浪拍打礁石" --async

使用 --async 参数后台执行,避免长时间阻塞。

3.4 语音合成(TTS)

mmx speech synthesize --text "你好,世界" --out hello.mp3

3.5 音乐生成(带歌词)

mmx music generate --prompt "流行摇滚" --lyrics "[主歌]阳光照亮街道"

3.6 图像理解(Vision)

mmx vision photo.jpg

3.7 网络搜索

mmx search "MiniMax AI 最新动态"

# JSON 输出
mmx search query --q "最新动态" --output json

3.8 其他命令

# 查看配额
mmx quota

# 更新 CLI
mmx update

四、配置管理

# 查看当前配置
mmx config show

# 设置配置项
mmx config set --key region --value cn

# 导出配置 schema(JSON 格式)
mmx config export-schema | jq .

五、专为 AI Agent 设计的技术特性

5.1 输出隔离(–quiet / –output json)

mmx image "prompt" --output json --quiet

确保 Agent 解析输出时不受干扰,数据干净。

5.2 语义化 Exit Code

不用解析英文错误信息,Agent 可直接通过 Exit Code 判断错误类型:
- 0:成功
- 1:通用错误
- 2:认证错误
- 3:配额不足
- …

5.3 异步模式(–async)

长耗时任务(如视频生成)使用 --async 避免阻塞,适合非交互式环境。

5.4 一个 Agent 跑通完整工作流

原文描述:”一个 Agent 可以独立跑通’根据项目文档生成演示视频并配上语音解说’这样的完整工作流。”

这意味着:

文档理解(vision/chat)
    ↓
生成相关图像
    ↓
生成视频(--async)
    ↓
生成语音解说
    ↓
最终输出

全部一条命令链搞定,无需为每个模态单独写 MCP Server。


六、与 MCP 的关系

传统方式:每个模态一个 MCP Server

Claude Code ← MCP → 图像生成 Server
          ← MCP → 语音合成 Server
          ← MCP → 视频生成 Server
          ← MCP → ...

每个模态都要:
- 找或自己写 MCP Server
- 适配接口
- 调试通信

使用 MMX-CLI:零 MCP,零适配

Claude Code / OpenClaw ← mmx 命令 → MiniMax 全模态 API

一个 CLI 原生调用所有模态,无需编写任何 MCP Server。

这实际上是 MiniMax 官方提供的”一站式 MCP 替代方案”。


七、适用场景

场景 说明
OpenClaw/Cursor/Claude Code 增强 npx skills add 一键接入全模态能力
自动化脚本 写 Shell/Python 脚本调用 mmx 生成内容
Agent 工作流 多模态内容生成一条龙,无需分别对接 API
快速原型验证 命令行直接试玩各种生成能力
无界面服务器环境 纯 CLI,无需 GUI

八、技术原理推测

基于公开信息推测:

mmx-cli(Node.js CLI)
    ↓
MiniMax API(REST)
    ↓
各模态模型
    ├── 文本:MiniMax-M2.5 / MiniMax-fast
    ├── 图像:MiniMax Image Gen
    ├── 视频:MiniMax Video Gen
    ├── 语音:MiniMax TTS
    └── 音乐:MiniMax Music Gen

关键设计:
- Command + Subcommand 结构mmx <module> <action>
- 统一认证层:API Key / OAuth
- 统一错误处理:语义化 Exit Code
- Agent 友好输出--output json --quiet


九、一句话总结

MMX-CLI = MiniMax 全模态能力的”一键接入点”,让 Agent 无需写任何 MCP Server,原生调用文字、图像、视频、语音、音乐生成。

对于已经在用 OpenClaw 或 Claude Code 的开发者,这是目前最轻量的 MiniMax 多模态集成方案。


十、相关链接

资源 地址
GitHub https://github.com/MiniMax-AI/cli
官方文档 https://github.com/MiniMax-AI/cli/blob/main/README_CN.md
npm mmx-cli
Skill 安装 npx skills add MiniMax-AI/cli -y -g
MiniMax 开放平台 https://www.minimax.io/

本文由 AI 辅助整理,供技术学习参考。