将 PDF 转为可引用的结构化内容,支持解析、抽取、问答与渲染。
从现有材料看,这是一个开源的本地 PDF 处理型 MCP 工具,未声明需要密钥或远程端点,整体偏低风险。主要注意点在于其作为 MCP 服务会在本机执行代码并访问用户提供的 PDF/输出数据,且项目社区采用度与维护状态证据较弱。
材料明确写明“无”密钥/环境变量,未见要求 API key、token 或账号凭证;当前未发现明显的凭证泄露或滥用面。
未声明任何远程端点 host,描述也聚焦于本地 PDF 解析、渲染与问答能力;基于现有材料,未见明确将用户数据外发到第三方服务的事实。
系统检查项显示其会执行代码;作为 MCP server,通常需要在本机启动进程并处理 PDF 解析/渲染任务。这属于该类工具的常规能力,需注意运行环境隔离与依赖执行面,但材料未见进一步红旗。
其功能需要读取用户提供的 PDF,并可能生成 HTML、引用框或渲染结果,因此对本地文档内容存在访问面。按描述看属于完成声明功能所需的常规数据访问,未见申请明显超范围权限的证据。
项目为可审计开源仓库且采用 MIT 许可证,这显著降低了供应链不透明风险;但来源为第三方 registry,社区采用度仅 0 star、维护状态未知,说明成熟度与持续维护证据偏弱,建议在审查依赖和锁定版本后使用。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"okraPDF PDF MCP server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
读取这份合同 PDF,按版面结构解析内容,并提取签约方、合同金额、生效日期、终止条款等字段,输出为 JSON,并为每个字段附上页码和边界框引用。
结构化 JSON 字段结果,并带可定位到原文位置的引用信息。
比较这几份研究报告 PDF,回答“各报告对市场增长率的预测有何差异?”,并引用每个结论对应的原文位置。
一份整合后的对比答案,包含多文档来源依据与精确引用。
把这份 PDF 转成可访问的 HTML,尽量保留标题层级、表格和段落结构,并生成可用于后续问答的引用信息。
结构清晰的 HTML 内容,以及适合检索和问答使用的引用数据。
帮助你导入 PDF 并进行语义检索问答,返回带来源引用的答案。