mcp-llm-behave

为大模型输出提供离线语义相似度回归测试与行为验证能力

许可证

MIT License

来源

third_party_registry

更新于

2026-06-16

// 安全评估需留意

本机运行进程
开源可审计
有许可证· MIT License

正在进行安全审计…

凭证密钥
网络外发
代码执行
数据访问
来源供应链

// 安装

复制安装指令，让 AI 自动完成配置 · 推荐新手

"mcp-llm-behave" 暂无可直接复制的安装信息，请查看页面文档或源码仓库。

// 用法示例

验证提示词改动影响

输入

请对同一组测试提示分别运行旧版与新版提示词输出，并用离线语义相似度比较结果，标记语义漂移明显的样本，生成回归测试报告。

预期产出

一份包含相似度分数、异常样本和整体变化结论的回归测试报告。

评估模型升级是否稳定

输入

将当前模型版本与升级后的模型版本在同一批基准用例上进行行为回归测试，不调用任何外部 API，输出差异统计和失败案例列表。

预期产出

模型升级前后的一致性分析、失败用例清单及稳定性判断。

为本地 LLM 建立测试基线

输入

基于已有问答样本为本地部署的大模型建立行为测试基线，后续每次改动后执行离线语义相似度检查，并输出是否通过测试。

预期产出

可复用的测试基线配置，以及每次执行后的通过/失败结果摘要。

// 文档

该资产暂无文档说明

可前往源码仓库查看用法与示例。

前往源码仓库 ↗

// 功能相似

MCP 工具

ai.llmse/mcp

通过 LLM 搜索引擎的 MCP 服务检索信息并为智能体提供外部知识。

—装→

MCP 工具

mcp-llm-gateway

通过 MCP 将大模型请求转发到兼容 OpenAI 的服务提供商。

—装→

mcp-llm-behave

// 用法示例

// 文档

// 功能相似

ai.llmse/mcp

mcp-llm-gateway

cn-llm-mcp

openai-mcp

Eval_MCP

AI App MCP