最新更新:

    创建模型评测任务

    创建入口

    在模型详情页,点击模型评测按钮,跳转至评测任务创建页面。

    备注

    仅部分模型支持创建评测任务。如果所需模型没有"模型评测"选项,请联系平台管理员。

    配置参数说明

    进入模型评测任务创建页面后,填写以下配置信息,完成后点击创建评测

    参数 说明
    任务名称 自定义评测任务名称
    模型 ID 平台中的模型标识
    评测框架 选择评测框架:OpenCompass、EvalScope 或 lm-evaluation-harness
    数据集选择 从数据集列表中选择一个或多个评测基准数据集
    资源类型 共享资源:使用公共算力,需排队;专属资源:独占算力,按时间计费

    查看评测结果

    创建完成后,可通过顶部导航进入模型训练评测 → 模型评测查看所有评测任务的运行状态和评测结果;也可在资源管理页面中统一查看。

    相关文档