智能知识

博客

我们不训练模型，但是我们很在乎模型学会了什么。就像培养一个孩子，并不是简单地把手机和电视遥控器塞给他。真正重要的是教育理念、是价值观、是对哪些问题对社会重要的判断———那些无法明确穷举、却决定模型能否为用户提供价值的细微之处。

Rubric第四讲：如何用Rubric把控数据质量

质量和速度一定是矛盾的吗？本文介绍一面千识研究院的"可信规模化"实践，通过评分量表体系构建从需求定义、共同设计、验证校准到规模化生产的四阶段质量闭环。

2025年12月9日

千识研究院发布

Rubric第三讲：如何科学的设计和优化rubric

评分量表不仅仅是规定，更是一种可迭代的预测模型。本讲从结构化设计、质量衡量（如评分者一致率）和质量提升三个维度，深入解析了Rubric背后的科学原理。

2025年12月5日

千识研究院发布

Rubric第二讲：深入了解不同类型的rubric及其使用场景

设计评分量表时，需要从颗粒度与特异性两个维度做决策，并决定评估应关注模型生成答案的过程还是结果。本文解答了衡量什么、在哪里衡量以及如何衡量三个核心问题。

2025年12月5日

千识研究院发布

Rubric第一讲：评分量表（Rubrics）如何帮助提升大模型可靠性

结构化评分量表为生成式AI提供可操作、可复用的评估框架，帮助从直觉式评估过渡到系统化、多维度的质量衡量，显著提升可靠性与一致性。

2025年11月21日

千识研究院发布

低代码：数据标注界面的终极解决方案

在AI快速发展的时代，数据标注任务日益复杂多样，从LLM Arena的对抗性评估到Agent的复杂交互流程标注，传统固化的标注模板已难以满足高频定制化需求。

2025年8月4日

王冲发布

从原始数据到高质量标注：标注系统背后的流水线是如何运作的？

随着大模型对高质量数据需求的激增，传统的"人海战术"标注方式已无法满足现代AI训练需求。本文深入剖析如何构建现代化数据标注系统的工作流程。

2025年7月25日

刘先发布

有了顶尖专家，为什么还无法产出好数据？

大模型竞赛进入下半场，模型公司之间在算法和算力的投入的边际效益快速收窄，真正能拉开模型能力差距的是未曾载于书籍与互联网，但存在于各行各业专家经验之中的"专家数据"。

2025年6月8日

曾资文发布

我们为什么做Xpert Studio

我们正处在一个由AI驱动的巨大变革时代，AI的价值正从"在实验室解决难题、刷新排行榜" 转向"在实际经济活动中发挥真正价值"。

2025年5月13日

汪涉洋发布

博客_

我们不训练模型，但是我们很在乎模型学会了什么。 就像培养一个孩子，并不是简单地把手机和电视遥控器塞给他。真正重要的是教育理念、是价值观、是对哪些问题对社会重要的判断———那些无法明确穷举、却决定模型能否为用户提供价值的细微之处。

千识研究院发布

Rubric第四讲：如何用Rubric把控数据质量

2025年12月9日

千识研究院发布

Rubric第三讲：如何科学的设计和优化rubric

2025年12月5日

千识研究院发布

Rubric第二讲：深入了解不同类型的rubric及其使用场景

2025年12月5日

千识研究院发布

Rubric第一讲：评分量表（Rubrics）如何帮助提升大模型可靠性

结构化评分量表为生成式AI提供可操作、可复用的评估框架，帮助从直觉式评估过渡到系统化、多维度的质量衡量，显著提升可靠性与一致性。

从原始数据到高质量标注：标注系统背后的流水线是如何运作的？

随着大模型对高质量数据需求的激增，传统的"人海战术"标注方式已无法满足现代AI训练需求。本文深入剖析如何构建现代化数据标注系统的工作流程。

我们正处在一个由AI驱动的巨大变革时代，AI的价值正从"在实验室解决难题、刷新排行榜" 转向"在实际经济活动中发挥真正价值"。

2025年5月13日