
博客
我们不训练模型,但是我们很在乎模型学会了什么。 就像培养一个孩子,并不是简单地把手机和电视遥控器塞给他。 真正重要的是教育理念、是价值观、是对哪些问题对社会重要的判断———那些无法明确穷举、却决定模型能否为用户提供价值的细微之处。
Rubric第四讲:如何用Rubric把控数据质量
质量和速度一定是矛盾的吗?本文介绍一面千识研究院的"可信规模化"实践,通过评分量表体系构建从需求定义、共同设计、验证校准到规模化生产的四阶段质量闭环。
2025年12月9日
千识研究院发布
Rubric第三讲:如何科学的设计和优化rubric
评分量表不仅仅是规定,更是一种可迭代的预测模型。本讲从结构化设计、质量衡量(如评分者一致率)和质量提升三个维度,深入解析了Rubric背后的科学原理。
2025年12月5日
千识研究院发布
Rubric第二讲:深入了解不同类型的rubric及其使用场景
设计评分量表时,需要从颗粒度与特异性两个维度做决策,并决定评估应关注模型生成答案的过程还是结果。本文解答了衡量什么、在哪里衡量以及如何衡量三个核心问题。
2025年12月5日
千识研究院发布
Rubric第一讲:评分量表(Rubrics)如何帮助提升大模型可靠性
结构化评分量表为生成式AI提供可操作、可复用的评估框架,帮助从直觉式评估过渡到系统化、多维度的质量衡量,显著提升可靠性与一致性。
2025年11月21日
千识研究院发布
低代码:数据标注界面的终极解决方案
在AI快速发展的时代,数据标注任务日益复杂多样,从LLM Arena的对抗性评估到Agent的复杂交互流程标注,传统固化的标注模板已难以满足高频定制化需求。
2025年8月4日
王冲发布
从原始数据到高质量标注:标注系统背后的流水线是如何运作的?
随着大模型对高质量数据需求的激增,传统的"人海战术"标注方式已无法满足现代AI训练需求。本文深入剖析如何构建现代化数据标注系统的工作流程。
2025年7月25日
刘先发布
有了顶尖专家,为什么还无法产出好数据?
大模型竞赛进入下半场,模型公司之间在算法和算力的投入的边际效益快速收窄,真正能拉开模型能力差距的是未曾载于书籍与互联网,但存在于各行各业专家经验之中的"专家数据"。
2025年6月8日
曾资文发布
我们为什么做Xpert Studio
我们正处在一个由AI驱动的巨大变革时代,AI的价值正从"在实验室解决难题、刷新排行榜" 转向"在实际经济活动中发挥真正价值"。
2025年5月13日
汪涉洋发布
博客_
我们不训练模型,但是我们很在乎模型学会了什么。 就像培养一个孩子,并不是简单地把手机和电视遥控器塞给他。 真正重要的是教育理念、是价值观、是对哪些问题对社会重要的判断———那些无法明确穷举、却决定模型能否为用户提供价值的细微之处。
