最新更新:

    模型微调介绍

    什么是模型微调

    平台提供高性能 GPU 加速的微调实例托管服务,支持主流微调框架(LLaMA-FactoryMS-Swift),用户只需选择算力和数据集,即可快速对大模型进行定制化训练,无需编写复杂的训练代码。

    支持的微调框架

    框架 特点
    LLaMA-Factory 提供可视化 Web 训练界面(LlamaBoard),支持多种微调方法(LoRA、QLoRA、全参数微调等),易于上手
    MS-Swift 魔搭社区出品,支持大量国内外主流模型,提供丰富的微调算法和量化选项

    核心功能

    • 一键启动:在模型详情页点击微调按钮,自动分配算力并挂载模型环境。
    • 全生命周期管理:涵盖微调创建、训练过程指标监控及模型导出。
    • 框架可视化界面:LLaMA-Factory 内置可视化训练面板,无需命令行即可配置训练参数。
    • 灵活的算力配置:可按需选择不同规格的 GPU 资源。
    • 模型导出:微调完成后,可将训练产生的权重导出为独立的模型仓库。

    微调流程

    选择基座模型 → 创建微调实例 → 配置数据集和训练参数 → 启动训练 → 监控训练指标 → 导出微调模型
    

    相关文档