跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://qitor.mintlify.app/llms.txt

Use this file to discover all available pages before exploring further.

Desktop Starter 基准测试

desktop-starter 是 QitOS 第一个官方多模态入门基准测试族。 它被定义为 OSWorld 兼容入门包
  • 桌面与计算机使用任务结构
  • 截图 + 无障碍 + OCR + UI 候选项
  • 与供应商无关的 GUI 动作
  • 统一的 BenchmarkRunResult
  • qita 回放、导出与可视化检查
不是对完整官方 OSWorld 对等性的宣称。

运行入门基准测试

qit bench run \
  --benchmark desktop-starter \
  --split starter \
  --strategy desktop_smoke \
  --output ./artifacts/desktop-starter-smoke.jsonl
真实模型路径:
qit bench run \
  --benchmark desktop-starter \
  --split starter \
  --strategy desktop_baseline \
  --model-family qwen \
  --model-name qwen-plus \
  --base-url https://dashscope.aliyuncs.com/compatible-mode/v1 \
  --output ./artifacts/desktop-starter.jsonl
真实基准测试适配器现在已经独立放到 osworld