教程：回放并检查失败运行

这节课从运行已经存在开始。问题不再是”它跑完了吗”，而是”它为什么会这样运行”，以及”两次运行到底差在哪里”。

第一步：打开面板

qita board --logdir ./runs

面板是最快的总览入口，你可以先看到：

选择一个 stop_reason=max_steps、exception 或解析器明显异常的运行，然后执行：

qita replay --run ./runs/<run_id>

在运行概览里，先检查这些项：

这一步会先告诉你：这个运行到底是否可比较。

在运行页面里优先看：

这通常能快速判断失败来源是：

通过面板上的对比控件，或直接打开：

/compare?left=RUN_A&right=RUN_B

v0.3 的差异视图聚焦在高价值字段：

这是回答”到底变了什么”的最快路径。

当你要把一次失败复盘分享给协作者时：

qit bench export --run ./runs/<run_id> --html ./reports/failed_run.html

这样团队讨论会始终围绕同一份追踪记录产物，而不是零散截图。

QitOS 当前的回放是尽力而为的。它足够支持：

但它不承诺远程供应商或外部环境永远给出严格一致的输出。