MCP-Playwright: 赋予AI模型操控浏览器的能力
在人工智能快速发展的时代,我们一直在寻找让AI与现实世界更好地交互的方式。今天我想向大家介绍一个强大的开源项目:MCP-Playwright,它正在改变AI模型与Web环境交互的方式。
源码地址:https://github.com/executeautomation/mcp-playwright
什么是MCP-Playwright?
MCP-Playwright是一个基于模型上下文协议(Model Context Protocol)的服务器,它为大型语言模型(LLM)提供了使用Playwright进行浏览器自动化的能力。简单来说,这个项目让像Claude、GPT等AI模型拥有了"眼睛和手",能够真实地浏览网页、点击按钮、填写表单,甚至执行复杂的自动化测试流程。
由ExecuteAutomation团队开发的这个项目在GitHub上已经获得了2.5k+的星标,证明了开发者社区对这种技术的热情。项目遵循MIT许可证,采用TypeScript作为主要开发语言,为AI赋予了前所未有的Web交互能力。
MCP-Playwright提供的核心功能
1. 代码生成功能
对于测试工程师和开发者来说,MCP-Playwright提供了强大的测试代码生成能力:
- 开始/结束代码生成会话:记录浏览器操作并转换为可重用的测试脚本
- 自定义生成选项:可以设置输出路径、测试名称前缀、是否包含注释等
- 会话管理:获取会话信息或在需要时清除会话
这意味着AI模型可以协助创建完整的自动化测试套件,极大提高了测试效率。
2. 浏览器交互功能
MCP-Playwright提供了丰富的浏览器交互工具:
基本导航控制
// 导航到特定URL,可选择浏览器类型和视口大小
playwright_navigate({ url: "https://example.com", browserType: "chromium" })// 在浏览器历史中导航
playwright_go_back()
playwright_go_forward()
页面元素交互
// 点击页面元素
playwright_click({ selector: "#submit-button" })// 填写表单
playwright_fill({ selector: "#username", value: "testuser" })// 选择下拉菜单项
playwright_select({ selector: "#country", value: "China" })// 悬停在元素上
playwright_hover({ selector: ".menu-item" })// 拖放操作
playwright_drag({ sourceSelector: "#item", targetSelector: "#dropzone" })// 键盘操作
playwright_press_key({ key: "Enter" })
内容获取与分析
// 获取页面文本内容
playwright_get_visible_text()// 获取HTML结构
playwright_get_visible_html()// 截取屏幕截图
playwright_screenshot({ name: "homepage", fullPage: true })// 保存页面为PDF
playwright_save_as_pdf({ outputPath: "/downloads", filename: "page.pdf" })
高级浏览器功能
// 执行JavaScript脚本
playwright_evaluate({ script: "document.title = 'New Title';" })// 获取控制台日志
playwright_console_logs({ type: "error" })// 设置自定义用户代理
playwright_custom_user_agent({ userAgent: "MyCustomBot/1.0" })
网络请求监控
// 监听网络请求
playwright_expect_response({ id: "login", url: "*/api/login" })
playwright_assert_response({ id: "login", value: "success" })
3. API请求功能
除了浏览器交互,MCP-Playwright还提供了直接的API交互能力:
// 执行GET请求
playwright_get({ url: "https://api.example.com/data" })// 执行POST请求
playwright_post({url: "https://api.example.com/users",value: JSON.stringify({ name: "John" }),headers: { "Content-Type": "application/json" }
})// 其他HTTP方法
playwright_put({ url: "...", value: "..." })
playwright_patch({ url: "...", value: "..." })
playwright_delete({ url: "..." })
使用场景与价值
MCP-Playwright的应用场景非常广泛:
- 自动化测试:AI可以创建、执行和维护Web应用的自动化测试
- 内容抓取:可以智能地从网站提取数据和信息
- 流程自动化:自动完成重复的Web任务,如表单填写、数据输入等
- 体验验证:验证网站的UI/UX功能和用户体验
- 教育演示:可视化展示Web交互过程,辅助教学
- 交互式学习:AI可以实际操作网页,进行更深入的学习和分析
如何安装和使用
MCP-Playwright提供了多种安装方式,让不同环境的开发者都能轻松上手:
NPM安装
npm install -g @executeautomation/playwright-mcp-server
先在cmd命令行执行上面的命令,注意node需要20以上的版本
其他安装方式
MCP-Get安装
npx @michaellatman/mcp-get@latest install @executeautomation/playwright-mcp-server
Smithery安装(专为Claude Desktop)
npx -y @smithery/cli install @executeautomation/playwright-mcp-server --client claude
VS Code安装
code --add-mcp '{"name":"playwright","command":"npx","args":["@executeautomation/playwright-mcp-server"]}'
在Claude配置
{"mcpServers": {"playwright": {"command": "cmd","args": ["/c","npx","-y","@executeautomation/playwright-mcp-server"]}}
}
找到
claude_desktop_config.json
文件,将上面代码的复制在其中
下载claude客户端,按右上角file ——> settings
然后选择Developer ——> Edit Config
就找到了json文件
然后将按照上面的格式将内容复试上去
然后重启claude就可以发现有个
run
,就可以使用了
在哪些环境中可以使用MCP-Playwright?
MCP-Playwright当前支持多种AI集成环境:
- Claude Desktop
- Cline
- Cursor IDE
- VS Code (通过GitHub Copilot代理)
- 其他支持MCP的环境
结语:AI与Web交互的未来
MCP-Playwright代表了AI与Web交互的一个重要进步。通过这个工具,AI模型不再是被动的信息处理者,而是能够主动探索和交互的Web公民。这为AI辅助测试、内容分析、流程自动化等领域开辟了新的可能性。
随着这类技术的发展,我们可以期待AI在Web领域扮演更加积极的角色,协助我们完成更复杂、更有价值的任务。无论你是开发者、测试工程师还是AI爱好者,MCP-Playwright都值得你关注和尝试。
对于想深入了解这个项目的读者,可以访问MCP-Playwright的GitHub仓库获取更多信息。
你对AI操控浏览器有什么想法?你认为这项技术会如何改变Web开发和测试的未来?欢迎在评论区分享你的观点!
相关文章:
MCP-Playwright: 赋予AI模型操控浏览器的能力
在人工智能快速发展的时代,我们一直在寻找让AI与现实世界更好地交互的方式。今天我想向大家介绍一个强大的开源项目:MCP-Playwright,它正在改变AI模型与Web环境交互的方式。 源码地址:https://github.com/executeautomation/mcp-…...
Scala集合计算高级函数及案例
一、说明 1.过滤:遍历集合,获取满足指定条件的元素组成新集合 2.转化 / 映射(map):将集合中的每个元素映射到某一个函数 List(1, 2, 3, 4, 5, 6, 7, 8, 9)中每个元素加 1,得到List(2, 3, 4, 5, 6, 7, 8,…...
如何测试一个API接口?从原理到实践详解
在微服务架构和前后端分离的现代软件开发中,API接口是系统的“血管”,承担着数据传输与逻辑处理的核心功能。本文将用通俗的语言,结合实例,系统讲解API接口测试的原理、方法及工具,助你掌握这一关键技能。 目录 …...
弹簧质点系统(C++实现)
本文实现一个简单的物理算法:弹簧质点系统(Mass-Spring System)。这是一个经典的物理模拟算法,常用于模拟弹性物体(如布料、弹簧等)的行为。我们将使用C来实现这个算法,并结合链表数据结构来管理…...
java设计模式-代理模式
代理模式(proxy) 基本介绍 1、代理模式:为一个对象提供一个替身,一控制对这个对象的访问。即通过代理对象访问目标对象。这样做的好处是:可以在目标对象实现的基础上,增强额外的功能操作,及扩展目标对象的功能。 2、被…...
【比赛编排软件的设计与实现】
有个朋友想要一个比赛编排软件,闲来无事,花几个晚上的时间帮忙编写了一下,主要本人也比较喜欢看NBA,想尝试实现类似的功能。最终实现功能展示如下: 】Reactor
核心代码 Epoller.hpp #pragma once#include "nocopy.hpp" #include <cerrno> #include <sys/epoll.h> #include <unistd.h> #include <string.h> #include "Log.hpp"class Epoller : public nocopy //类Epoller继承自nocopy类&a…...
山东大学计算机网络第五章习题解析
参考教材:计算机网络:自顶向下方法:原书第 8 版 / (美)詹姆斯F. 库罗斯(James F. Kurose),(美)基恩W. 罗斯(Keith W. Rose)著…...
openexr-2.3.0-windows编译
本文操作按照《c&c开源库编译指南》中内容规范编写,编译环境配置、工具下载、目录规划,及更多其他开源库编译方法请参考该文章。 c&c开源库编译指南:https://blog.csdn.net/binary0006/article/details/144086155 本文章中的源代码已…...
【NLP 面经 8】
目录 一、文本生成任务 模型架构方面 训练数据方面 生成策略方面 二、命名实体识别任务NER 模型架构方面 特征工程方面 训练优化方面 三、情感分析任务 模型架构方面 训练数据方面 超参数调整方面 四、计算余弦相似度并添加符合条件结果 提示: 思路与算法 任由深渊的…...
Qt项目——记事本
目录 前言工程文档一、功能介绍二、界面预览三、UI设计师工具四、给三个按钮设置贴图五、信号与槽六、实现文件打开功能代码实现代码实现 七、实现文件保存代码内容 八、实现文件关闭代码实现 九、显示高亮和行列位置代码实现 十、实现快捷功能代码实现 总结 前言 这个项目就是…...
WHAT - React 惰性初始化
目录 在 React 中如何使用惰性初始化示例:常规初始化 vs. 惰性初始化1. 常规初始化2. 惰性初始化 为什么使用惰性初始化示例:从 localStorage 获取值并使用惰性初始化总结 在 React 中,惰性初始化(Lazy Initialization)…...
HOW - 如何测试 React 代码
目录 一、使用 React 测试库:testing-library/react二、使用测试演练场:testing-playground.com三、使用 Cypress 或 Playwright 进行端到端测试四、使用 MSW 在测试中模拟网络请求 一、使用 React 测试库:testing-library/react testing-li…...
React 条件渲染
开发环境:Reacttsantd 通常你的组件会需要根据不同的情况显示不同的内容。在 React 中,你可以通过使用 JavaScript 的 if 语句、&& 和 ? : 运算符来选择性地渲染 JSX。 例子 我们在满足 isPacked{true} 条件的物品清单旁加上一个勾选符号✔。…...
使用 Canal 实现 MySQL 与 ES 数据同步的技术实践
前言 本文将详细讲解如何使用阿里的 Canal 工具,实现 MySQL 向 ES(Elasticsearch)的数据同步。 数据同步有多种方式,双写同步数据方式因性能慢、存在分布式事务及数据一致性问题、业务耦合度高且难以扩展,不适合采用…...
《实战AI智能体》什么是 Scrum 项目管理及为什么需要它
Scrum 项目管理是一种敏捷项目管理方法,强调团队合作、迭代开发和客户参与。它的核心概念包括 Scrum 团队、产品待办事项列表、Sprint、每日站立会议、Sprint 回顾会议等。Scrum 团队由产品负责人、Scrum 主管和开发团队组成,他们共同负责项目的规划、执行和交付: 产品待办事…...
智能硬件开发革命:低代码平台+物联网
物联网和低代码开发 初识物联网 物联网的概念 20 世纪末,随着计算机网络和通信技术的兴起,互联网开始走进并融入人们的生活。传统互联网通常以人作为主体,数据的产生和传输都在人的控制下进行,数据的应用结果也在具体的人身上得…...
「合诚」携手企企通共建新材料和健康产业采购数智化新生态
在科技革命与产业变革深度融合的时代背景下,新材料与健康产业正迎来数字化、智能化的快速发展。 技术突破与消费升级的双重驱动,推动着行业不断创新,同时也对企业的供应链管理提出了更高要求。 1、合诚:聚焦新材料与健康产业&am…...
ansible角色
一、角色 role 本质上就是目录 /etc/ansible/roles 1、创建角色 tree查看目录结构 在同一个角色中,相互引用文件、操作时,不需要添加任何路径 删除角色,将角色目录中的角色文件删除 案例:部署zabbix agent 执行角色...
WHAT - React 元素接收的 ref 详解
目录 1. ref 的基本概念2. 如何使用 ref2.1 基本用法2.2 类组件使用 createRef 3. forwardRef 转发 ref4. ref 的应用场景5. ref 和函数组件总结 在 React 中,ref(引用)用于访问 DOM 元素或类组件实例。它允许我们直接与元素进行交互…...
数字游戏(继Day 10)
主体: #include<stdio.h> #include<time.h> #include<stdlib.h>#include"mygetch.h"#define MAX 51 //定义测试字母的最大长度void help() {printf("\n****************************************");printf("\n*输入过程中无法退出…...
react 中将生成二维码保存到相册
需求:生成二维码,能保存到相册 框架用的 react 所以直接 qrcode.react 插件,然后直接用插件生成二维码,这里一定要写 renderAs{‘svg’} 属性,否则会报错,这里为什么会报错??&#…...
React-05React中props属性(传递数据),propTypes校验,类式与函数式组件props的使用
1.类式组件props基本数据读取与解构运算符传递 <script type"text/babel">// 创建组件class PersonalInfo extends React.Component {render() {// 读取props属性 并读取值console.log(props,this.props);return(<ul><li>姓名:{this.p…...
export default function?在react中在前面还是后面呢?
好的!我将通过几个具体场景的代码示例,展示不同 export default 使用方式的适用情况,并给出推荐实践。 场景 1:基础组件(推荐直接导出) 适用情况:简单组件,无需额外处理 // 方式A:…...
红米手机输入正确密码也无法解锁的问题的可尝试解决方法
文章目录 问题现象官方途径没看到有能给解决的可尝试解决方法(汇总小红书成功解决方法,但从回复来看,多为成功的个例,整体而言希望不大)重启/强制重启尝试之前的密码等待一晚上后再次尝试输入密码,包括重启…...
优选算法系列(6.模拟)
一.替换所有的问号(easy) 题目链接:1576. 替换所有的问号 - 力扣(LeetCode) 解法: 纯模拟。从前往后遍历整个字符串,找到问号之后,就用 a ~ z 的每⼀个字符去尝试替换即可。 代码…...
罗技K860键盘
罗技蓝牙键盘的顶部功能键F1-F12的原本功能 单击罗技键盘的功能键时,默认响应的是键盘上面显示的快进、调节音量等功能。改变回F1~F12原本功能,同时按下 fn和esc组合键...
⭐算法OJ⭐数据流的中位数【最小堆】Find Median from Data Stream
最小堆 最小堆是一种特殊的完全二叉树数据结构。 基本定义 堆性质:每个节点的值都小于或等于其子节点的值(根节点是最小值)完全二叉树性质:除了最底层外,其他层的节点都是满的,且最底层的节点都靠左排列…...
node-modules-inspector 使用以及 node_modules可视化 依赖关联关系快速分析
node-modules-inspector 使用以及 node_modules可视化 依赖关联关系快速分析 node-modules-inspector 简介 node-modules-inspector 是一个用于分析和可视化 node_modules 依赖关系的工具,主要功能包括: 依赖可视化:以交互式图表展示项目的依…...
python自动登录远程设备的几种方式(华为设备)
其实登录远程设备(交换机路由器)的方式无非就是通过SSH或者是Telnet这两个协议,当然最主要的还是SSH,这里主要讲的是通过这两个协议登录远程设备的几个方式 拓扑 本文都是用的这个拓扑,主要通过编写python脚本来登录其…...
【android bluetooth 框架分析 01】【关键线程 1】【关键线程介绍】
1. 为什么学习蓝牙协议栈之前,必须先梳理清楚这几大线程? 为什么 学习协议栈之前 最好是要先梳理清楚 关键线程 bt_stack_manager_threadbt_jni_threadbt_main_threadbt_a2dp_sink_worker_thread 1.1 蓝牙协议栈是典型的“多线程异步系统” 蓝牙协议…...
LDAP高效数据同步:Syncrepl复制模式实战指南
#作者:朱雷 文章目录 一、Syncrepl 复制简介1.1. 什么是复制模式1.2. 什么是 syncrepl同步复制 二、Ldap环境部署三、配置复制类型3.1. 提供者端配置3.2. 消费者端配置3.3.启动服务3.4.测试同步是否生效 四、总结 一、Syncrepl 复制简介 1.1. 什么是复制模式 Ope…...
SeeGround: See and Ground for Zero-Shot Open-Vocabulary 3D Visual Grounding
CVPR 2025 核心问题与动机 问题背景:3D视觉定位(3DVG)要求根据文本描述在3D场景中定位目标物体,是增强现实、机器人导航等应用的关键技术。传统方法依赖标注的3D数据集和预定义类别,限制了其在开放场景中的扩展性。现…...
深入理解Spring IoCDI
1. 引言:为什么需要IoC和DI? 传统开发方式的耦合性问题 在传统开发中,对象通常通过 new 关键字直接创建,例如: // 直接依赖具体实现类 UserService userService new UserServiceImpl(); OrderService orderService…...
NO.78十六届蓝桥杯备战|数据结构-并查集|双亲表示法|初始化|查询|合并|判断|亲戚|Lake Counting|程序自动分析(C++)
双亲表⽰法 接下来要学习到的并查集,本质上就是⽤双亲表⽰法实现的森林。因此,我们先认识⼀下双亲表⽰法。 在学习树这个数据结构的时,讲到树的存储⽅式有很多种:孩⼦表⽰法,双亲表⽰法、孩⼦双亲表⽰法以及孩⼦兄弟表…...
20250407-组件v-model
基本用法 v-model 可以在组件上使用以实现双向绑定。 首先看下 v-model 在原生元素上的用法: <input v-model"searchText" /> 在代码背后,模板编译器会对 v-model 进行更冗长的等价展开。因此上面的代码其实等价于下面这段ÿ…...
oracle 存储体系结构
oracle 存储体系结构 参考: Logical Storage Structures (oracle.com)...
晋城市电子健康证上传照片尺寸要求及手机拍照制作方法
晋城市餐饮从业人员健康证电子照片上传有着明确的技术规范。根据"晋城市从业人员电子健康证明服务平台"要求,照片尺寸应为358像素(宽)441像素(高),这一比例符合标准证件照的规格。照片底色可选择…...
STL c++ list——模拟实现
结点类的模拟实现 list是一个带头双向循环链表 因需要实现一个节点类,其中包含哨兵位(用来标识位置),节点信息(val数据,prev后指针,next后指针) template<class T> struct …...
【ES系列】Elasticsearch从入门到精通保姆级教程 | 启篇
🔥 本系列将带你从零开始学习Elasticsearch,通过保姆级教程,手把手教你掌握这个强大的搜索与分析引擎。无论你是完全的新手,还是想系统学习ES的开发者,这个系列都能满足你的需求。 📚博主匠心之作,强推专栏: JAVA集合专栏 【夜话集】JVM知识专栏数据库sql理论与实战【…...
图解Java运行机制-JVM、JRE、JDK区别
以下是Java运行机制及JVM、JRE、JDK区别的图解与说明: --- ### 一、Java程序运行机制 1. **编写与编译** Java源文件(.java)通过**JDK中的编译器(javac)**编译为字节码文件(.class)ÿ…...
UML类图综合实验三补档
1.使用简单工厂模式模拟女娲(Nvwa)造人(Person),如果传入参数“M”,则返回一个Man对象,如果传入参数“W”,则返回一个Woman对象,用Java语言实现该场景。现需要增加一个新的Robot类,如果传入参数“R”&#…...
OpenHarmony子系统开发 - DFX(八)
OpenHarmony子系统开发 - DFX(八) 八、Faultlogger开发指导 概述 功能简介 Faultlogger是OpenHarmony为开发者提供的一个维测日志框架,能够为应用、元能力、系统服务进程崩溃故障提供统一检测、日志采集、日志存储、日志上报功能…...
C# virtual 和 abstract 详解
简介 在 C# 中,virtual 和 abstract 关键字都用于面向对象编程中的继承和多态,它们主要用于方法、属性和事件的定义,但在用法上存在一些重要的区别。 virtual 关键字 virtual 表示可重写的方法,但可以提供默认实现,…...
红宝书第三十二讲:零基础学会模块打包器:Webpack、Parcel、Rollup
红宝书第三十二讲:零基础学会模块打包器:Webpack、Parcel、Rollup 资料取自《JavaScript高级程序设计(第5版)》。 查看总目录:红宝书学习大纲 一、模块打包器是什么? 把分散的HTML/CSS/JS文件 组合成浏览…...
DeepSeek 在金融领域的应用解决方案
DeepSeek 在金融领域的应用解决方案 一、背景 随着人工智能技术的快速发展,DeepSeek 作为一款国产大模型,凭借其强大的语义理解、逻辑推理和多模态处理能力,在金融行业迅速崭露头角。金融行业作为经济的核心,面临着激烈的市场竞…...
linux 处理2个文件的差集
命令 grep -Fvxf 文件1 文件2 -F 将模式视为固定字符串,而非正则表达式。 -v 反向匹配,输出不匹配的行。 -x 精确匹配整行,避免部分匹配。 -f 文件1 从文件1中读取模式。 示例 执行命令 grep -Fvxf a1.txt a2.txt...
vue3中pinia基本使用
一、安装以及引入 安装:npm install piniamain.js文件: import { createApp } from "vue"; import { createPinia } from "pinia"; import App from "./App.vue";const pinia createPinia() const app createApp(App)…...