$ loading_

mcp-llm-offload — askskill

$ ~/registry/mcp/jonpol01-mcp-llm-offload-2

MCP

mcp-llm-offload

将轻量大模型任务分流到自有模型，节省高端模型额度与成本。

许可证

MIT License

来源

third_party_registry

更新于

2026-06-19

// 安全评估需留意

本机运行进程
开源可审计
有许可证· MIT License

总评

该 MCP 工具为开源 MIT 项目，材料显示无必需密钥且未声明固定远程端点，整体未见明确高风险红旗；但其具备代码执行能力，且文档极少、社区采用度低，使用时仍需留意实际配置与运行范围。

凭证密钥低风险

材料明确标注“需要的密钥/环境变量：无”，未见要求提供 API key、token 或其他敏感凭证；基于现有材料，凭证暴露与滥用面较低。

网络外发需留意

系统检查项写明“远程端点 host：无”，未见固定外发目标；但描述称可将轻量 LLM 任务转交给“本地 LLM 或任何 OpenAI-compatible provider”，说明实际部署时可能按用户配置把内容发送到外部模型服务，需核实运行配置与数据流向。

代码执行需留意

系统已客观标注该工具“executes-code”，说明其具备在本机运行服务逻辑的代码执行能力；这属于 MCP 工具常见能力，当前材料未显示超出声明功能的系统权限申请，但应在受限环境中运行并观察其实际调用行为。

数据访问需留意

材料未提供 README 或详细权限说明，因此无法从文档确认其可读写的本地文件、缓存或会话数据范围；鉴于其作为 MCP 服务处理用户提示并可能转发给其他模型，建议按最小权限原则限制其可访问的数据面。

来源供应链需留意

正面因素是其开源且采用 MIT 许可证，可进行源码审计；但来源为 third_party_registry，社区采用度为 0 star、维护状态未知，且缺少 README，供应链透明度与成熟度一般，建议先审代码和依赖再投入生产。

安全建议

在隔离环境中先运行并抓取网络流量，确认是否会把提示或上下文转发到外部 OpenAI-compatible 服务。
审查源码与依赖锁定情况，重点确认默认连接目标、日志内容以及是否存在隐式数据缓存。
按最小权限部署，限制其文件系统、环境变量与进程级访问范围。
若接入外部模型提供方，单独评估该提供方的数据保留、传输加密与合规策略。

审计模型: gpt-5.4 · 2026-06-19

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"mcp-llm-offload" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

分流摘要与改写任务

输入

把以下非关键文本处理任务转交给我配置的 OpenAI 兼容模型：先总结这篇会议纪要，再改写成一封简短邮件，保留关键行动项。

预期产出

返回由外部模型生成的摘要与邮件草稿，减少主模型配额消耗。

本地模型处理代码样板

输入

使用本地 LLM 生成一个 Node.js MCP 客户端示例，包含连接、错误处理和基础日志，不需要复杂推理。

预期产出

得到基础代码样板与说明，把简单生成任务从前沿模型中卸载出去。

批量分类低优先级内容

输入

把这批客服工单标题交给我控制的模型进行主题分类，输出标签和置信度；只有低置信度项再交给 Claude 处理。

预期产出

先由自有模型完成批量分类，并筛出需要更强模型复核的少量结果。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具

mcp-llm-offload

将轻量大模型任务分流到自控模型，节省高端模型配额与成本。

—装→

MCP 工具

mcp-local-llm

将摘要、分类、信息提取和草拟等机械任务委派给本地大模型处理。

—装→

mcp-llm-offload

// 用法示例

// 文档

// 功能相似

mcp-llm-offload

mcp-local-llm

cn-llm-mcp

MCP LLM Server

Local LLM MCP Tool

mcp-llm-router