$ loading_
用于运行与验证 AI Agent 技能的测试用例,检查输出质量与稳定性。
复制安装指令,让 AI 自动完成配置 · 推荐新手
"agent-skills-eval" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请运行 agent-skills-eval,对我的 AI 技能执行全部测试用例,并汇总通过率、失败原因和改进建议。
返回测试结果汇总,包括通过率、失败项详情和可执行的优化建议。
我更新了技能提示词和输出格式,请用 agent-skills-eval 重新跑回归测试,对比更新前后的表现差异。
输出更新前后对比结果,指出哪些指标提升、下降或出现新的失败。
请使用 agent-skills-eval 多次重复执行同一组测试,找出结果不稳定的用例,并分析可能原因。
给出波动较大的测试用例列表,并说明可能的随机性来源或提示词问题。
用于快速测试技能接入是否正常,并验证基础问答与输出效果。
根据网站文档自动生成可复用的 AI 代理技能说明与配置草案
帮助用户扫描Agent Skills安全风险并进行可视化管理与排查。
提供面向 AI 编码代理的测试技能目录,帮助快速查找与应用 QA 能力。
统一管理并同步海量 Agent 技能到多种 AI 编码工具与客户端
帮助你创建、整理、校验并重构 AgentSkills 与 SKILL.md 技能文件。