模型微调介绍
什么是模型微调
平台提供高性能 GPU 加速的微调实例托管服务,支持主流微调框架(LLaMA-Factory、MS-Swift),用户只需选择算力和数据集,即可快速对大模型进行定制化训练,无需编写复杂的训练代码。
支持的微调框架
| 框架 | 特点 |
|---|---|
| LLaMA-Factory | 提供可视化 Web 训练界面(LlamaBoard),支持多种微调方法(LoRA、QLoRA、全参数微调等),易于上手 |
| MS-Swift | 魔搭社区出品,支持大量国内外主流模型,提供丰富的微调算法和量化选项 |
核心功能
- 一键启动:在模型详情页点击微调按钮,自动分配算力并挂载模型环境。
- 全生命周期管理:涵盖微调创建、训练过程指标监控及模型导出。
- 框架可视化界面:LLaMA-Factory 内置可视化训练面板,无需命令行即可配置训练参数。
- 灵活的算力配置:可按需选择不同规格的 GPU 资源。
- 模型导出:微调完成后,可将训练产生的权重导出为独立的模型仓库。
微调流程
选择基座模型 → 创建微调实例 → 配置数据集和训练参数 → 启动训练 → 监控训练指标 → 导出微调模型