跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://qitor.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

QitOS 提供了一套稳定的 AgentModule + Engine 内核(kernel),用于构建可复现的 LLM 智能体(agent)。无论你是在原型化 ReAct 循环、运行 GAIA 基准测试(benchmark),还是交付一个面向真实工作流的编程智能体,运行结果始终可追踪、可组合、可复现。 一个长时间运行的 QitOS 编程任务不应该退化成难以理解的胶水代码。 QitOS 实时编程运行

QitOS 中的两种编写方式

QitOS 提供两种智能体编写方式。

研究优先(research-first)

这是研究者的默认入口。 你可以手写:
  • 系统提示词(prompt)
  • 解析器(parser)——将原始模型输出解析为决策(decision)的组件
  • 模型协议(protocol)——模型输出的格式契约
  • 模型传输层(transport)——与模型 API 通信的客户端
  • 工具面(tool surface)
这是框架里最接近 PyTorch 风格的路径:直接、显式、便于实验。

预设优先(preset-first)

当你需要稳定基线(baseline)或快速切换模型家族时,可以选择预设优先方式。 你会从这些层开始:
  • 家族预设(family preset)
  • 适配层策略(harness policy)
  • 预设工具构建器
这条路径尤其适合同一个智能体在 Qwen、Kimi、MiniMax、gpt-oss 与 Gemma 4 之间切换的场景。

QitOS 适合谁

QitOS 主要面向三类实践者:
  • 研究者:原型化 ReAct、PlanAct、Tree-of-Thought、Reflexion 与新的智能体方法,并获得可回放(replay)、可对比、可发表的追踪记录(trace)。
  • 智能体构建者:在稳定执行循环上构建使用工具的智能体,而不是反复手写围绕裸 LLM 调用的框架胶水。
  • 评测者:在和产品智能体相同的内核上运行 GAIA、Tau-Bench 与 CyBench,让基准测试结果真正能够迁移。

核心能力

可复现的运行

每次 QitOS 运行都会产出 manifest.jsonevents.jsonlsteps.jsonl。这些文件记录模型 ID、提示词哈希、配置哈希、随机种子、工具清单等关键信息,足以精确复现或比较两次运行。

内置可观测性:qita

qita 是 QitOS 自带的追踪记录查看器。任意一次运行结束后,启动看板即可查看逐步执行、回放运行轨迹,并导出(export)成独立 HTML。
qita board --logdir runs
看板默认运行在 http://127.0.0.1:8765,当新运行出现时会自动刷新。

规范化的智能体模式

QitOS 内置四种经典推理模式,对应的可运行示例位于 examples/patterns/
模式说明
ReAct文本协议,每步至多执行一个核心动作(action)
PlanAct先生成显式计划,再按步骤执行
Tree-of-Thought先分支、评分,再决定执行路径
ReflexionActor-Critic 循环,带基于证据的重试

基准测试适配器

QitOS 提供 GAIA、Tau-Bench 与 CyBench 适配器,它们都运行在与你自定义智能体相同的 AgentModule + Engine 内核上,不需要另一套独立评测框架。

特色设计

这些设计决定了 QitOS 不只是智能体工具集合,而是一套清晰的运行时(runtime)方法论。

单内核架构

QitOS 最核心的约束只有一条:一次运行只有一个运行时内核。
  • AgentModule 定义策略
  • Engine 负责执行
  • 工具、解析器、评估器(critic,可批准、停止或重试当前步骤的后置评估组件)、记忆与追踪都附着在这条主链路上
这样示例、基准测试和生产型智能体之间就能保持可比性。

协议感知的提示词与解析器

QitOS 把提示词格式与解析器选择当作一等设计契约:
  • ReAct 提示词搭配 ReActTextParser
  • JSON 提示词搭配 JsonDecisionParser
  • XML 提示词搭配 XmlDecisionParser
  • Terminus、MiniMax 工具调用解析器等结构化变体也仍然走同一条 model response -> parser -> Decision 路径
正因为这层契约是显式的,追踪记录才不会退化成提供商特定的隐式胶水。协议和解析器的匹配关系始终可审计。

以预设为优先的智能体编写方式

QitOS 提供可复用的编写模块,不需要每个智能体从零开始组装一切:
  • coding_tools(...)advanced_coding_tools(...)web_tools()task_tools(...)
  • WindowMemorySummaryMemoryVectorMemoryMarkdownFileMemory
  • WindowHistoryTokenBudgetSummaryHistoryCompactHistory
  • NumberedPlanBuilderDynamicTreeSearch
研究者可以调整策略,而不必重搭整套基础设施。

面向长时运行的上下文控制

长时运行智能体是 QitOS 的一等公民。你可以通过这些层次控制上下文膨胀:
  • HistoryPolicy 控制消息选择
  • TokenBudgetSummaryHistory 做 token 预算感知的摘要
  • CompactHistory 做多阶段上下文压缩(compaction)
  • 记忆适配器负责语义检索与持久记忆
这也是 QitOS 的研究价值所在:框架帮你研究长时运行,而不是假设上下文是免费的。

追踪优先的可观测性

QitOS 的假设是:只要一次运行重要,它就应该可检查。 每次追踪运行都会产出结构化产物(artifact),而 qita 会把它们变成:
  • 用于比较多次实验的看板
  • 用于逐步理解单次运行的回放
  • 用于分享与审计的导出

不引入新运行时的领域专门化

QitOS 一个关键的设计点是:领域智能体仍然是普通的 QitOS 智能体。 Claude Code 风格智能体、基准测试运行器、代码安全审计智能体都复用了同一个运行时。领域行为体现在:
  • 状态设计
  • 提示词策略
  • 工具组合
  • reduce() 归约(reduce)语义
专门化因此更容易理解,也更容易复现。

当前状态

QitOS 当前处于 Alpha 阶段。稳定的基础主要是 AgentModule + Engine 内核、qita 追踪与可观测性流程、规范化示例以及基准测试适配器。更高层的便捷 API、部分 kit 模块和实验性工具集仍可能持续演进。若你正在评估采用路径,建议从内核与示例入手,不要假设所有 API 表面都已冻结。

接下来读什么

快速开始

2 分钟内运行第一个智能体

教程课程

通过四节课程理解 QitOS 的智能体设计方法

安装

安装 QitOS 及其可选组件

核心概念

理解 AgentModule、Engine、State 与 Tools

智能体模式

查看 ReAct、PlanAct、ToT 与 Reflexion 的模式地图

Kit 参考

浏览内置解析器、工具集、记忆、规划与历史策略

追踪与 qita

了解 QitOS 如何让每次运行都可检查、可回放、可导出