智能知识

产品

Data

在这里，我们展示的是已经打磨完成的数据集与我们支持的训练范式。它们不是为"跑分"而生，而是为真实使用场景而构建。

Terminal RL Data（终端强化学习数据）

Coding AgentDevOps AutomationCLI Tool Use

光靠模拟场景永远无法造就真正的智能。我们的终端 RL 数据由多年经验的软件、运维、安全、数据工程师和科研经验丰富的STEM 硕博亲手设计，每个场景都源自真实工作流，原创且具备切实的经济价值。任务难度经过精心分级，确保模型始终处于有效的探索空间之中。所有轨迹均在严格的沙箱环境下逐条验证，每一步命令都可执行、可复现、可评分。

11/03/2026

MCP（模型上下文协议数据）

Agentic WorkflowsBrowser Agent

工具调用的能力决定了Agent的上限。我们的 MCP 数据集由具备多年工程实战经验的专家团队从零构建，覆盖多轮对话、跨工具协作与多跳推理等高复杂度场景，每一条数据都来自原创设计，而非改写或合成。任务难度横跨初级到专家级，充分释放模型的学习潜力；配套的程序化验证环境确保每条轨迹真实可跑，奖励信号精准、无歧义。

03/03/2026

GDPVal（高经济价值工作成果数据）

Document GenerationExcel/Spreadsheet AgentFinancial Analysis

能帮助用户提升工作效率的不是一个五万字的超长回复，而是内容和表达都恰到好处的一份文档、ppt或者报表。我们的 GDPVal 数据集由互联网、金融、医疗、法律的行业专家主导生成，场景真实、原创，直接对应产品设计、项目运营、科研、尽调报告、财务报表等高价值产物。严格的校验框架对每条数据在真实世界的用例进行端到端核查，确保推理过程可追溯、结论可信赖。

15/02/2026

产品