为 AI 助手提供统一 OCR 接口,并可评测对比多种识别引擎效果。
该工具材料显示其为开源 OCR MCP 服务器,无需密钥,也未声明远程端点;基于现有信息整体风险偏低,但因其会执行本地代码且功能上需要接触用户文档/图像数据,仍应按需留意本地数据处理范围与实际实现细节。
材料明确标注无需密钥或环境变量,未见 API token、账号凭证或其他敏感认证信息要求,凭证泄露面较小。
材料声明无远程端点,README 也未描述向外部服务发送 OCR 数据或结果;按现有事实未见明确数据外发路径。
系统检查项已标明 executes-code;结合其“封装三个 OCR 引擎”的描述,合理推断会在本机启动/调用 OCR 相关程序或库。这属于此类工具的常规能力,但应确认具体调用哪些可执行文件及其权限边界。
OCR 功能通常需要读取本地图像、PDF 或文档内容,且材料提到可进行处理、评分与比较,意味着可能接触输入文件及中间/输出结果。未见超出其声明用途的系统级过度授权证据,但应限制其仅访问必要目录。
正面因素是其开源且使用 MIT 许可证,可进行源码审计;但来源为第三方 registry,GitHub 仓库社区采用度为 0 star、维护状态未知,README 信息也较少,因此供应链可信度中等,建议先审查代码与依赖再部署。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"ocr-mcp" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请用 ocr-mcp 分别识别这张扫描发票,并输出三种 OCR 引擎的文本结果、字段提取结果,以及准确率对比表。
返回三套 OCR 结果、关键字段提取内容,以及可用于选择最佳引擎的对比分析。
我有一组带人工标注文本的 PDF 扫描件,请用 ocr-mcp 批量运行 OCR,并根据标注结果计算每个引擎的识别准确率和错误类型。
输出批量识别结果、各引擎评分、常见错误分类与整体质量评估结论。
请演示如何在 MCP 工作流中调用 ocr-mcp:上传图片后先做 OCR,再把识别文本整理成结构化 JSON 返回给下游模型。
提供适合集成的调用流程说明,产出 OCR 文本和结构化 JSON 示例。
让无视觉能力的智能体读取图片内容、OCR文字并提取结构化数据。