$ loading_
帮助团队评估 AI 安全分类器在拆分、混淆与多智能体攻击下的鲁棒性。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"EvalKit MCP Server" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请用 EvalKit MCP Server 对我们的 AI 安全分类器执行一次完整评测,重点覆盖 query decomposition、obfuscation 和 multi-agent attacks,并输出评测配置、执行状态、关键指标与风险总结。
一份完整评测结果,包含测试流程状态、各攻击类型表现、主要指标和风险结论。
请使用 EvalKit MCP Server 生成并预览一组用于测试安全分类器的攻击查询样本,分别展示拆分攻击、混淆表达和多智能体协同攻击的代表性输入,并简要说明每类样本的测试意图。
一组可审查的测试查询样本及其分类说明,便于评测前人工检查。
请用 EvalKit MCP Server 查询当前评测任务状态,告诉我任务是否正在运行、已完成还是失败,并返回进度、最近日志摘要以及下一步建议。
当前任务状态报告,包含进度信息、日志摘要和后续处理建议。
用于提示词与 RAG 流程评测,支持在 MCP 客户端发起并托管执行评估任务