应用场景
- 异构算力管理
文档中心
- 行业大模型平台
- v3.4

简体中文
- English
- 简体中文
Star

最新更新:

模型评测常见问题

常见问题

评测按钮置灰，提示"评测框架暂未支持"

原因：当前评测框架暂时不支持该模型。

解决方案：请联系平台管理员，告知需要支持的模型名称和相关信息，管理员将评估后尽快添加支持。

评测任务长时间处于"等待中"

原因：选择了共享资源，当前公共算力队列繁忙。

解决方案：

耐心等待队列排空（共享资源评测任务按提交顺序执行）。
如需立即执行，可切换为专属资源（按时间计费）。

评测结果分数异常偏低

可能原因：

所选评测数据集与模型的训练语言不匹配（如用中文数据集评测英文模型）。
模型缺少对应任务的指令跟随能力（基座模型 vs 指令微调模型）。
评测框架参数配置不合理。

解决方案：

选择与模型语言和任务类型匹配的评测数据集。
对于基座模型，使用适合预训练模型的评测方式（如困惑度评测）。
参考评测框架介绍了解各框架适用场景。

如何使用自定义数据集评测

请参考自定义评测数据集文档了解详细操作步骤。