$ loading_
在用户自有算力上驱动机制可解释性实验与特征探针分析
复制安装指令,让 AI 自动完成配置 · 推荐新手
"openinterp-mcp" 暂无可直接复制的安装信息,请查看页面文档或源码仓库。
请使用 openinterp-mcp 在我的 Colab 环境中,对这个语言模型层的 SAE 特征进行实验设计与执行,比较不同特征在给定文本样本上的激活情况,并输出关键发现与下一步建议。
一份实验结果摘要,包含特征激活对比、可疑模式、结论与后续实验建议。
请基于 openinterp-mcp 对指定神经元或表示子空间做 probe-causality 分析,测试它们与模型输出行为的关系,并整理实验步骤、指标和结论。
结构化分析报告,说明哪些表示与目标行为相关,以及因果干预后的影响。
我想研究这个模型在某类任务上的内部机制,请用 openinterp-mcp 规划一个可执行的研究流程,包含实验顺序、所需工具、数据准备方式和结果记录模板。
一套清晰的研究方案,帮助用户按步骤开展机制可解释性实验并复现实验记录。
通过命令行连接和调用 MCP 服务器,便于调试、测试与集成 AI 工具链。