第一步:打开 board
- stop reason
- step count
- event count
- token usage
- parser warnings
- official-run 与 replay 元信息
第二步:打开一个失败 run
选择一个stop_reason=max_steps、exception 或 parser 明显异常的 run,然后执行:
official runreplay modegit SHApackageseedprompt protocolparser
第三步:检查 parser 与 context telemetry
在 run 页面里优先看:- parser diagnostics
- context occupancy timeline
- compaction markers
- model response summary
- protocol 不匹配
- tool 选择错误
- context 饱和
- benchmark 环境准备失败
第四步:比较两个 runs
通过 board 上的 compare 控件,或直接打开:- stop reason
- final result
- step count
- event count
- token usage
- latency
- cost
- parser diagnostics
- first failure step
- run config diff
第五步:导出 artifact
当你要把一次失败复盘分享给协作者时:Best-effort replay 提醒
QitOS 当前的 replay 是 best effort。 它足够支持:- 研究调试
- benchmark review
- prompt / parser 回归分析
- artifact 分享
