创建模型评测任务
创建入口
在模型详情页,点击模型评测按钮,跳转至评测任务创建页面。
备注
仅部分模型支持创建评测任务。如果所需模型没有"模型评测"选项,请联系平台管理员。
配置参数说明
进入模型评测任务创建页面后,填写以下配置信息,完成后点击创建评测:
| 参数 | 说明 |
|---|---|
| 任务名称 | 自定义评测任务名称 |
| 模型 ID | 平台中的模型标识 |
| 评测框架 | 选择评测框架:OpenCompass、EvalScope 或 lm-evaluation-harness |
| 数据集选择 | 从数据集列表中选择一个或多个评测基准数据集 |
| 资源类型 | 共享资源:使用公共算力,需排队;专属资源:独占算力,按时间计费 |
查看评测结果
创建完成后,可通过顶部导航进入模型训练评测 → 模型评测查看所有评测任务的运行状态和评测结果;也可在资源管理页面中统一查看。