💥 告别Playwright?AI驱动的自动化神器来了

💥 告别Playwright?AI驱动的自动化神器来了

整理时间: 2026-02-12 10:24
来源: 今日头条 - 群聊分享
整理人: AI助手
原文链接: 💥 告别Playwright?AI驱动的自动化神器来了 - 今日头条

摘要

本文介绍了一个名为 Stagehand 的开源浏览器自动化框架,它结合了 Playwright 的稳健性和 AI 的灵活性,通过自然语言 API 实现网页自动化操作,解决了传统爬虫工具维护困难、AI Agent 成本高昂的问题。


正文

01 Playwright 的脚本一改 UI 就挂?Firecrawl 只能读不能写?

做过爬虫或自动化测试的兄弟们都知道,最头疼的莫过于网站改版

辛辛苦苦写的 CSS Selector,甚至只是改了一个 class 名,整个脚本就崩了。这叫“脆弱性”(Brittleness)

而且现在的工具两极分化严重:
- Playwright:执行快但难维护,还得自己写死代码
- AutoGPT:灵活是灵活,但跑得慢、死贵、还容易跑飞

有没有一种中间路线?既有代码的稳健,又有 AI 的聪明?

今天给大伙推荐个新开源的神器:Stagehand

它的口号很狂:专为 AI 时代设计的浏览器自动化框架


02 它是怎么工作的?

Stagehand 最大的特点就是:把 AI 融入了底层

它不让你去扣 div > span.btn-primary 这种选择器,而是给你提供了一套基于自然语言的 API

你不需要告诉它”点击第3个div”,你只需要告诉它:

“Act: 点击那个加入购物车的按钮”

这背后有四个核心大招:

1. Act(行动):像人一样操作

这是最核心的功能。你直接用人话下指令:

page.act("click the login button")

这玩意儿最强的地方在于“自愈”。哪怕网站改版了,登录按钮从左边移到了右边,颜色从红变蓝,只要它还是个”登录按钮”,AI 就能认出来,脚本照样跑!

而且它有缓存机制,第一次运行可能会慢点(因为要调大模型),第二次就飞快了。

⛏️ 2. Extract(提取):告别正则表达式

以前提取数据,最烦的就是写正则。现在?你直接用人话定义一个 JSON 结构,告诉它你要啥:

page.extract("提取商品价格和名称", { 
  name: string, 
  price: number 
})

它自动把网页里乱七八糟的 HTML 给你清洗成干净的 JSON。

3. Observe(观察):自动分析页面

这是给 Agent 用的。它能分析当前页面有哪些可交互元素。

比如你丢给它一个页面,问它:”这里面哪些能点?”

它会返回一个列表:”有登录按钮、注册链接、搜索框……”

这对于做通用的 AI 助理非常有帮助。

4. Agent(智能体):全自动驾驶

如果说前面是辅助驾驶,这个就是 L4 级自动驾驶

你直接给个目标:”帮我投递这个岗位”。

它自己规划路径:点击申请 -> 填表 -> 上传简历 -> 提交。


03 为什么要关注它?

现在市面上的工具,Playwright 是”手排挡”,精准但累;Firecrawl 是”阅读器”,把网页转成 Markdown 给 AI 看,但它很难操作网页。

Stagehand 填补的就是这个空白:它是一个能”写”能”操作”的浏览器框架。

对于程序员来说,它能极大地降低维护成本。对于想做 AI 应用(比如自动订票、自动填表)的开发者来说,它是目前最好的基建之一。

最重要的是,它是开源的!基于 Playwright 构建,意味着你可以无缝集成到现有的 Node.js 项目里。

以后写爬虫,可能真的只要会说话就行了。


要点提炼

  • Stagehand 是专为 AI 时代设计的浏览器自动化框架
  • 核心特色:将 AI 融入底层,提供自然语言 API
  • 四大功能:Act(行动)、Extract(提取)、Observe(观察)、Agent(智能体)
  • “自愈”能力:网站改版后仍能识别元素,脚本不易崩溃
  • 开源项目:基于 Playwright,可无缝集成 Node.js 项目
  • 适用场景:爬虫、自动化测试、AI 应用开发(自动订票、填表等)

相关链接/资源


标签

人工智能 #开源项目 #爬虫 #自动化测试 #程序员干货 #Stagehand #Playwright #浏览器自动化