提供网页抓取与批量采集能力,支持选择器提取、隐身模式和自动化处理。
该 MCP 工具材料显示其主要功能是网页抓取,且无需密钥、未声明固定远程端点;结合其开源属性,整体未见明确高风险红旗,但因具备执行代码与网络抓取能力、来源维护信号较弱,建议按需谨慎使用。
材料明确标注无需密钥或环境变量,未见要求提供 API token、账号凭证或其他敏感认证信息,因此凭证泄露面较小。
工具功能为抓取 URL,意味着会按用户输入访问外部网站并产生网络出站流量;材料未声明额外第三方服务端点,当前更像是面向目标网页的常规抓取,而非将数据外发到无关后端。
系统已标记其具备 executes-code,说明会在本机运行工具代码/进程以执行抓取与批处理;这属于 MCP 工具常规能力,材料未显示超出声明用途的高权限系统操作。
从描述看,工具至少可访问用户指定 URL 返回的网页内容,并可能处理批量抓取结果;材料未说明会读取哪些本地文件或执行广泛文件写入,因此当前未见明显过度授权,但数据处理边界不够清晰。
存在可审计的开源仓库,这是降低风险的正面因素;但来源为第三方注册表、仓库未声明许可证、社区采用度为 0 star、维护状态未知,整体供应链信号偏弱,建议在审阅代码与依赖后再用于敏感环境。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"scrapling-mcp" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请使用 scrapling-mcp 抓取这 20 个商品页面,提取商品标题、价格、评分和库存状态,优先用 CSS 选择器;如果页面结构不一致,再补充 XPath 方案,并将结果整理成 JSON 数组。
返回结构化的商品数据列表,包含每个页面提取字段及可能的选择器说明。
请用 scrapling-mcp 抓取这个新闻栏目页,提取所有文章标题、链接和发布时间;如果站点有反爬限制,请启用隐身模式,并输出为 CSV 可用的表格格式。
输出新闻标题、链接和时间的整洁表格,适合后续导出或分析。
请使用 scrapling-mcp 测试这个页面的 CSS 和 XPath 选择器,确认哪些能稳定提取正文、作者和发布日期,并说明每个选择器匹配到的结果数量。
返回可用选择器清单、匹配结果预览以及稳定性判断,便于后续抓取配置。
提供自托管网页抓取与爬取能力,便于 AI 工作流采集网络数据。