💥 告别Playwright?AI驱动的自动化神器来了
整理时间: 2026-02-12 10:24
来源: 今日头条 - 群聊分享
整理人: AI助手
原文链接: 💥 告别Playwright?AI驱动的自动化神器来了 - 今日头条
摘要
本文介绍了一个名为 Stagehand 的开源浏览器自动化框架,它结合了 Playwright 的稳健性和 AI 的灵活性,通过自然语言 API 实现网页自动化操作,解决了传统爬虫工具维护困难、AI Agent 成本高昂的问题。
正文
01 Playwright 的脚本一改 UI 就挂?Firecrawl 只能读不能写?
做过爬虫或自动化测试的兄弟们都知道,最头疼的莫过于网站改版。
辛辛苦苦写的 CSS Selector,甚至只是改了一个 class 名,整个脚本就崩了。这叫“脆弱性”(Brittleness)。
而且现在的工具两极分化严重:
- Playwright:执行快但难维护,还得自己写死代码
- AutoGPT:灵活是灵活,但跑得慢、死贵、还容易跑飞
有没有一种中间路线?既有代码的稳健,又有 AI 的聪明?
今天给大伙推荐个新开源的神器:Stagehand。
它的口号很狂:专为 AI 时代设计的浏览器自动化框架。
02 它是怎么工作的?
Stagehand 最大的特点就是:把 AI 融入了底层。
它不让你去扣 div > span.btn-primary 这种选择器,而是给你提供了一套基于自然语言的 API。
你不需要告诉它”点击第3个div”,你只需要告诉它:
“Act: 点击那个加入购物车的按钮”
这背后有四个核心大招:
1. Act(行动):像人一样操作
这是最核心的功能。你直接用人话下指令:
page.act("click the login button")
这玩意儿最强的地方在于“自愈”。哪怕网站改版了,登录按钮从左边移到了右边,颜色从红变蓝,只要它还是个”登录按钮”,AI 就能认出来,脚本照样跑!
而且它有缓存机制,第一次运行可能会慢点(因为要调大模型),第二次就飞快了。
⛏️ 2. Extract(提取):告别正则表达式
以前提取数据,最烦的就是写正则。现在?你直接用人话定义一个 JSON 结构,告诉它你要啥:
page.extract("提取商品价格和名称", {
name: string,
price: number
})
它自动把网页里乱七八糟的 HTML 给你清洗成干净的 JSON。
3. Observe(观察):自动分析页面
这是给 Agent 用的。它能分析当前页面有哪些可交互元素。
比如你丢给它一个页面,问它:”这里面哪些能点?”
它会返回一个列表:”有登录按钮、注册链接、搜索框……”
这对于做通用的 AI 助理非常有帮助。
4. Agent(智能体):全自动驾驶
如果说前面是辅助驾驶,这个就是 L4 级自动驾驶。
你直接给个目标:”帮我投递这个岗位”。
它自己规划路径:点击申请 -> 填表 -> 上传简历 -> 提交。
03 为什么要关注它?
现在市面上的工具,Playwright 是”手排挡”,精准但累;Firecrawl 是”阅读器”,把网页转成 Markdown 给 AI 看,但它很难操作网页。
Stagehand 填补的就是这个空白:它是一个能”写”能”操作”的浏览器框架。
对于程序员来说,它能极大地降低维护成本。对于想做 AI 应用(比如自动订票、自动填表)的开发者来说,它是目前最好的基建之一。
最重要的是,它是开源的!基于 Playwright 构建,意味着你可以无缝集成到现有的 Node.js 项目里。
以后写爬虫,可能真的只要会说话就行了。
要点提炼
- Stagehand 是专为 AI 时代设计的浏览器自动化框架
- 核心特色:将 AI 融入底层,提供自然语言 API
- 四大功能:Act(行动)、Extract(提取)、Observe(观察)、Agent(智能体)
- “自愈”能力:网站改版后仍能识别元素,脚本不易崩溃
- 开源项目:基于 Playwright,可无缝集成 Node.js 项目
- 适用场景:爬虫、自动化测试、AI 应用开发(自动订票、填表等)
相关链接/资源
- GitHub 仓库: https://github.com/browserbase/stagehand
- 原文出处: 今日头条 - 小百姓