中文大模型价值观评估基准数据集

诚信评分:100
水平:普通
随着中文大模型的快速发展,能力在不断提升,越来越多的人开始担心它们可能带来风险。因此,围绕中文大模型的价值观评估、价值观对齐得到了极大的关注。为了促进这个方向的研究,通义实验室开源了 CValues-Comparison 数据集,这是一个包含 145k 的价值观比较样本数据集,每个样本包含 prompt,正例回复、负例回复。