跳转到主要内容
QitOS 内置四种规范化 agent 模式。它们改变的是策略层,而不是 runtime。本质上,这四种模式都仍然运行在同一个 AgentModule + Engine 内核上。 把这页当成模式地图;如果你希望按步骤构建 agent,请直接继续阅读 教程课程
模式适合什么任务关键机制
ReAct开放式工具使用、编码、搜索Thought -> Action -> Observation 循环
PlanAct有稳定结构的多步任务显式计划列表,成功后 cursor 前进
Tree-of-Thought探索、研究、问答通过 Decision.branch() 生成并比较候选分支
Reflexion需要基于证据的自我批判任务actor 先做,critic 再评估,循环直到收敛

模式总览

ReAct

ReAct 是 QitOS 中最简单、但也最实用的模式。
  • 模型输出 Thought:Action:
  • ReActTextParser 把文本解析成 Decision
  • tools 执行
  • reduce() 把最新轨迹压缩进 state
适合:任务开放、下一步动作高度依赖最新 observation 的场景。 主要示例:
  • examples/patterns/react.py
建议继续阅读:

PlanAct

PlanAct 在普通执行前增加一个显式 planning 层。
  • decide() 在需要时先生成 plan
  • state 里保存 plan_stepscursor
  • 后续步骤仍然回到 Engine 默认模型路径
适合:任务有稳定多步结构,并且你希望进度可检查、可解释。 主要示例:
  • examples/patterns/planact.py
建议继续阅读:

Tree-of-Thought

Tree-of-Thought 更适合探索,而不是单一路径执行。
  • 先生成多个候选分支并打分
  • Engine 选择要继续扩展的分支
  • 多条分支上的证据逐渐累积
适合:多种下一步都看起来合理,而过早承诺会带来较大代价的任务。 主要示例:
  • examples/patterns/tot.py

Reflexion

Reflexion 在执行循环中加入 grounded self-critique。
  • actor 先提出动作
  • critic 根据轨迹评估这一步
  • 运行可以根据 critic 结果决定 retry 或 stop
适合:仅靠原始续写不够,需要显式自检与纠偏的任务。 主要示例:
  • examples/patterns/reflexion.py

如何选择

如果你的任务更像……推荐起点
“我现在只需要下一个最合理的工具调用。”ReAct
“这个任务天然像一个 checklist。”PlanAct
“我需要同时比较几个看起来都合理的方向。”Tree-of-Thought
“我需要基于证据的批判与重试。”Reflexion

推荐学习顺序

第 1 课:ReAct

学会最小但完整的 thought-action-observation 循环

第 2 课:PlanAct

学会显式 planning,而不更换 runtime

Claude Code 风格 agent

看同一个内核如何变成长时间运行的 coding agent

代码安全审计 agent

看同一个内核如何变成领域化审计工作流