$ loading_

okraPDF PDF MCP server — askskill

$ ~/registry/mcp/okrapdf-okrapdf-pdf-mcp-server

MCP

okraPDF PDF MCP server

将 PDF 转为可引用的结构化内容，支持解析、抽取、问答与渲染。

许可证

MIT License

来源

third_party_registry

更新于

2026-06-20

// 安全评估需留意

本机运行进程
开源可审计
有许可证· MIT License

总评

从现有材料看，这是一个开源的本地 PDF 处理型 MCP 工具，未声明需要密钥或远程端点，整体偏低风险。主要注意点在于其作为 MCP 服务会在本机执行代码并访问用户提供的 PDF/输出数据，且项目社区采用度与维护状态证据较弱。

凭证密钥低风险

材料明确写明“无”密钥/环境变量，未见要求 API key、token 或账号凭证；当前未发现明显的凭证泄露或滥用面。

网络外发低风险

未声明任何远程端点 host，描述也聚焦于本地 PDF 解析、渲染与问答能力；基于现有材料，未见明确将用户数据外发到第三方服务的事实。

代码执行需留意

系统检查项显示其会执行代码；作为 MCP server，通常需要在本机启动进程并处理 PDF 解析/渲染任务。这属于该类工具的常规能力，需注意运行环境隔离与依赖执行面，但材料未见进一步红旗。

数据访问需留意

其功能需要读取用户提供的 PDF，并可能生成 HTML、引用框或渲染结果，因此对本地文档内容存在访问面。按描述看属于完成声明功能所需的常规数据访问，未见申请明显超范围权限的证据。

来源供应链需留意

项目为可审计开源仓库且采用 MIT 许可证，这显著降低了供应链不透明风险；但来源为第三方 registry，社区采用度仅 0 star、维护状态未知，说明成熟度与持续维护证据偏弱，建议在审查依赖和锁定版本后使用。

安全建议

在隔离环境中运行该 MCP 服务，仅向其提供必要的 PDF 文件与目录权限。
优先审查仓库代码、依赖清单与锁定版本后再部署，避免直接跟随最新依赖。
处理敏感 PDF 时，先验证不会产生超出预期的本地输出、缓存或临时文件。
持续关注仓库后续维护情况；若长期无更新或缺乏问题响应，降低信任级别。

审计模型: gpt-5.4 · 2026-06-20

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"okraPDF PDF MCP server" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

提取合同字段

输入

读取这份合同 PDF，按版面结构解析内容，并提取签约方、合同金额、生效日期、终止条款等字段，输出为 JSON，并为每个字段附上页码和边界框引用。

预期产出

结构化 JSON 字段结果，并带可定位到原文位置的引用信息。

跨文档问答

输入

比较这几份研究报告 PDF，回答“各报告对市场增长率的预测有何差异？”，并引用每个结论对应的原文位置。

预期产出

一份整合后的对比答案，包含多文档来源依据与精确引用。

转换为可读 HTML

输入

把这份 PDF 转成可访问的 HTML，尽量保留标题层级、表格和段落结构，并生成可用于后续问答的引用信息。

预期产出

结构清晰的 HTML 内容，以及适合检索和问答使用的引用数据。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具

pdf-agent-mcp

从 PDF 提取文本层、目录与页内容，便于 AI 读取分析文档。

—装→

MCP 工具

MCP PDF Server

将 PDF 导入向量库后，帮助 AI 基于原文检索并回答文档问题。

—装→

okraPDF PDF MCP server

// 用法示例

// 文档

// 功能相似

pdf-agent-mcp

MCP PDF Server

pdf-knowledge-mcp

oxidize-pdf MCP Server

PDF RAG MCP Server

PDF MCP Server