$ loading_

scrapling-mcp — askskill

$ ~/registry/mcp/goodmartins-scrapling-mcp

MCP

scrapling-mcp

提供网页抓取与批量采集能力，支持选择器提取、隐身模式和自动化处理。

来源

third_party_registry

更新于

2026-06-17

// 安全评估需留意

本机运行进程
开源可审计

总评

该 MCP 工具材料显示其主要功能是网页抓取，且无需密钥、未声明固定远程端点；结合其开源属性，整体未见明确高风险红旗，但因具备执行代码与网络抓取能力、来源维护信号较弱，建议按需谨慎使用。

凭证密钥低风险

材料明确标注无需密钥或环境变量，未见要求提供 API token、账号凭证或其他敏感认证信息，因此凭证泄露面较小。

网络外发需留意

工具功能为抓取 URL，意味着会按用户输入访问外部网站并产生网络出站流量；材料未声明额外第三方服务端点，当前更像是面向目标网页的常规抓取，而非将数据外发到无关后端。

代码执行需留意

系统已标记其具备 executes-code，说明会在本机运行工具代码/进程以执行抓取与批处理；这属于 MCP 工具常规能力，材料未显示超出声明用途的高权限系统操作。

数据访问需留意

从描述看，工具至少可访问用户指定 URL 返回的网页内容，并可能处理批量抓取结果；材料未说明会读取哪些本地文件或执行广泛文件写入，因此当前未见明显过度授权，但数据处理边界不够清晰。

来源供应链需留意

存在可审计的开源仓库，这是降低风险的正面因素；但来源为第三方注册表、仓库未声明许可证、社区采用度为 0 star、维护状态未知，整体供应链信号偏弱，建议在审阅代码与依赖后再用于敏感环境。

安全建议

先审查 GitHub 仓库代码与依赖清单，再决定是否在生产或敏感环境启用。
将其运行在最小权限、受限网络的隔离环境中，避免抓取任务访问内网或敏感地址。
仅对可信目标站点使用，并限制批量抓取输入，防止误抓取敏感数据。
若需长期使用，优先确认维护活跃度、版本发布记录与许可证信息。

审计模型: gpt-5.4 · 2026-06-17

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"scrapling-mcp" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

批量抓取商品信息

输入

请使用 scrapling-mcp 抓取这 20 个商品页面，提取商品标题、价格、评分和库存状态，优先用 CSS 选择器；如果页面结构不一致，再补充 XPath 方案，并将结果整理成 JSON 数组。

预期产出

返回结构化的商品数据列表，包含每个页面提取字段及可能的选择器说明。

采集新闻站点标题与链接

输入

请用 scrapling-mcp 抓取这个新闻栏目页，提取所有文章标题、链接和发布时间；如果站点有反爬限制，请启用隐身模式，并输出为 CSV 可用的表格格式。

预期产出

输出新闻标题、链接和时间的整洁表格，适合后续导出或分析。

验证页面选择器是否有效

输入

请使用 scrapling-mcp 测试这个页面的 CSS 和 XPath 选择器，确认哪些能稳定提取正文、作者和发布日期，并说明每个选择器匹配到的结果数量。

预期产出

返回可用选择器清单、匹配结果预览以及稳定性判断，便于后续抓取配置。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具

Scrapling MCP Server

帮助用户以隐蔽请求或真实浏览器抓取网页数据，并支持 Cloudflare 绕过与 CSS 选择器提取。

—装→

MCP 工具

scrapy-mcp

帮助用户礼貌抓取网页并提取链接、表格与结构化内容，支持受限异步爬取

—装→

scrapling-mcp

// 用法示例

// 文档

// 功能相似

Scrapling MCP Server

scrapy-mcp

crawl4ai-mcp-server

MCP Web Scraper

crawl4ai-mcp-server

io.github.carrasquelalex1/webscrape-mcp