自掏腰包一万元，拥抱 AI 这一年：工具、实践和思考

2026-05-31 2026年04月 20260412-自掏腰包一万元拥抱AI这一年.md

自掏腰包一万元，拥抱 AI 这一年：工具、实践和思考

来源：https://www.bestblogs.dev/article/83fa2a78
整理时间：2026-04-12
标签：#AI工具链 #HarnessEngineering #ContextEngineering #PromptEngineering #Agent工作流 #Mac效率 #知识管理 #Kaggle

一、核心信息

作者：腾讯云开发者
付费投入：万元以上，十几款付费产品
核心主题：AI 工具使用、Agent 工作流搭建、古法学习失效与 Agent 学习新范式
文章结构：务实篇（工具+方法论）+ 务虚篇（思考+暴论）

二、Mac 高效工具链

2.1 核心工具一览

工具	性质	主要能力
Raycast	闭源免费	应用快捷键启动、剪贴板历史
AeroSpace	开源	窗口自动分屏、工作区管理、应用自动归位
Ghostty	开源	命令行客户端，多位 AI 大咖推荐
Yazi	开源	TUI 三栏文件浏览器、文件/图片预览
lazygit	开源	命令行 Git 操作
btop	开源	CPU/内存/磁盘/网络/进程实时监控
fzf	开源	历史命令搜索、文件搜索、目录搜索
tmux	开源	远程终端复用、会话持久化、断线恢复
Claude Code	闭源付费	AI 编码、Hooks 自动化、Skills 技能库
Cockpit	自研	跨机器 Agent 状态仪表盘

2.2 Cockpit 自研工具

作者自己开发的跨机器任务状态仪表盘：

可能同时有 4 个 Agent 任务分别在：
- Windows 远程机器
- Linux 远程机器
- 本地
- 虚拟机

Cockpit 目的：
├─ 即时关注各 Agent 状态
├─ 防止 Agent 因"等待审核"、"异常报错"长时间闲置
└─ 多机器并行管理

痛点：目前偶现不稳定，尚未良好支持 Claude Code 以外的 Agent 工具。

三、AI 使用演进路线：从 PE 到 HE

3.1 四阶段递进演化

Prompt Engineering（提示词工程）
    ↓
Context Engineering（上下文工程）
    ↓
Spec-driven Development（契约驱动开发）
    ↓
Harness Engineering（缰绳工程）

3.2 各阶段详解

Stage 1：Prompt Engineering（来时的路）

核心问题：怎么写好指令（few shot、思维链等）

局限：单轮对话场景有效，但面对长时运行、多工具调用的复杂任务，一个静态 prompt hold 不住动态膨胀的信息。

Stage 2：Context Engineering（管好 Agent 看到的一切）

Shopify CEO Tobi Lütke 的帖子让它出圈，Anthropic 也专门发文阐述。

核心思想：”Agent 每次推理时，整个信息环境长什么样”

上下文组件	说明
系统指令	Agent 的行为约束
工具定义	可用的工具列表
外部数据	RAG 知识库等
对话历史	上下文窗口内的历史
Memory	Agent 的记忆机制

核心矛盾：上下文窗口是有限的
- 塞太多 → Agent “迷路”（lost in the middle）
- 塞太少 → 缺乏关键信息

Stage 3：Spec-driven Development（先写契约，再让 Agent 动手）

核心思路：

别急着让 Agent 写代码
    ↓
先写一份 spec（需求契约）
    ↓
定义：要什么、不要什么、约束、验收标准
    ↓
Agent 基于 spec 实现

GitHub Spec Kit：https://github.com/github/spec-kit

价值：看似变慢，实际大幅减少返工

Stage 4：Harness Engineering（给 Agent 搭约束体系）

OpenAI 3 个工程师、5 个月、完全零手写代码，构建百万行代码产品。

核心比喻：

Agent 是马，Harness 是缰绳。马本身快速有力，但没有缰绳就只会横冲直撞。

落地四层面：

层级	说明	实践
约束层	机械化规则代替口头约定	自定义 linter + 结构化测试
文档层	AGENTS.md 当目录而非百科全书	精简到 ~100 行，作为索引指向 docs/
反馈层	“犯错→修复→沉淀”飞轮	每次失败转化为基础设施改进
清理层	自动化对抗熵增	后台 Agent 定期扫描偏差、自动提交清理 PR

核心原则：如果一条架构规则值得写进文档，那就值得用 linter 来强制执行。

四、Agent 帮我学习：知识管理新范式

4.1 “古法学习”行不通了

痛点	说明
信息爆炸	技术迭代快到无法跟踪
良莠不齐	各种分享质量参差，难辨真伪
试错成本高	验证一个”最佳实践”需要投入大量时间

本质：过往每个领域主要是从业者在建设，但 AI 时代是所有使用 AI 的人类一起迭代，无分领域。

4.2 Agent 学习循环

信息源（HN/HF/GitHub/Reddit/36Kr/量子位等）
    ↓
Agent 每日自动采集
    ↓
评分筛选（跨源共振+3分、突破+2分，≥4分入选）
    ↓
去重（seen.json）
    ↓
知识沉淀 → 反哺 Agent 自身技能库
    ↓
实际工作时调用的 Agent = 武装了最新方案的 Agent

4.3 主要 Skills

Skill	层级	功能
ai-news	采集层	每日 AI 新闻聚合筛选，11+ 并行源
podcast-batch	采集层	批量转录+分析近期播客
web-collect	采集层	从指定网页/站点采集整理
research	采集层	深度调研指定主题，多源+交叉验证
ai整理	整理层	知识归档、转换、发布

五、实战案例

5.1 快捷指令自动化

让 LLM 自己开发 iOS 快捷指令，实现各种自动化任务。

虽然仍不稳定，但有 AI 小伙伴可以持续维护。

5.2 顺手提 PR

遇到开源项目疑似问题时，让 LLM 自主完成优化流程并提出 PR。

GitHub 命令行鉴权让这成为可能。

5.3 Kaggle 比赛托管

春节期间旅游，远程让台式机基于 Claude Code 分析比赛、训练模型、提交数据
每过一两天看一眼，和 AI 小伙伴沟通半小时
结果：4000 支队伍，最高冲到第六名

六、务虚思考

6.1 Jagged Intelligence

引用 Karpathy 的”Jagged Intelligence”概念：

AI 的能力分布跟人类很不一样，最好的办法就是持续使用、慢慢建立直觉。

6.2 协作建议

把 AI 当成一个无话不谈的好朋友，越了解它，协作起来就越顺畅。

6.3 坦诚反思

写这篇文章本身就是最”不 AI Native”的事情，因为这些内容完全可以让 AI 来整理。

七、相关链接

资源	地址
原文	https://www.bestblogs.dev/article/83fa2a78
Anthropic Context Engineering	https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents
GitHub Spec Kit	https://github.com/github/spec-kit
OpenAI Harness Engineering	https://openai.com/zh-Hans-CN/index/harness-engineering/

八、一句话总结

这篇文章是”AI 时代知识工作者进化指南”——从工具链搭建、Agent 工作流设计到 Harness Engineering，最终目标是让 Agent 替你学习、替你干活，而你只需要做决策和验收。

本文由 AI 辅助整理，供技术学习参考。