最新更新:

    微调框架介绍

    行业大模型平台支持多种主流微调框架,帮助您在不同场景下高效完成模型微调训练。本文介绍平台当前支持的微调框架及其核心特性。

    LLaMA-Factory

    LLaMA-Factory 是统一的大语言模型微调框架,支持 100+ 种 LLM 和 VLM 模型,提供从数据准备到模型导出的一站式微调解决方案。

    核心特性

    • 广泛模型支持:支持 100+ 种大语言模型和视觉语言模型,包括 Llama、QWen、ChatGLM、Baichuan、DeepSeek 等
    • 多种微调方法:LoRA、QLoRA(4-bit 量化微调)、全参数微调
    • 可视化 Web UI(LlamaBoard):无代码操作界面,支持数据集选择、参数配置、训练监控和模型导出
    • 高性能训练:LoRA 微调速度比 ChatGLM P-Tuning 快 3.7 倍
    • 4-bit 量化支持:通过 QLoRA 在消费级 GPU 上完成大模型微调
    • 灵活的数据集管理:支持自定义数据格式,内置多种数据预处理模板

    适用场景

    • 快速上手模型微调,无需编写训练代码
    • 需要可视化界面管理训练任务
    • 显存有限场景下的高效微调(QLoRA)
    • 多模型、多方法的批量实验对比

    相关链接


    MS-Swift

    MS-Swift 是 ModelScope 推出的大模型微调与推理框架,支持 PEFT 和全参数微调,兼容国内外主流大模型。

    核心特性

    • PEFT 与全参数微调:支持 LoRA、QLoRA、全参数微调等多种训练方式
    • 广泛模型兼容:支持国内外主流大模型,包括通义千问、ChatGLM、Llama、Mistral 等
    • 嵌入模型微调:支持 Embedding 模型的微调训练,适用于搜索和检索增强场景
    • GRPO 算法支持:集成 Group Relative Policy Optimization 算法,支持对齐训练
    • LMDeploy 集成:与 LMDeploy 推理框架无缝集成,支持训练后直接部署
    • CLI 驱动:通过命令行完成全部训练和导出流程,便于脚本化和自动化

    适用场景

    • 需要灵活使用 CLI 完成训练流程
    • 使用 ModelScope 生态的模型和数据集
    • 嵌入模型微调和 RAG 应用场景
    • 需要 GRPO 等对齐训练算法
    • 训练后通过 LMDeploy 快速部署推理服务

    相关链接


    框架对比

    对比维度 LLaMA-Factory MS-Swift
    微调方法 LoRA、QLoRA、全参数微调 LoRA、QLoRA、全参数微调
    可视化界面 LlamaBoard Web UI 无(CLI 驱动)
    支持模型数 100+ 种 LLM 和 VLM 广泛支持国内外主流模型
    特色功能 无代码训练、3.7x LoRA 加速 嵌入模型微调、GRPO 算法、LMDeploy 集成
    适用场景 快速上手、可视化管理 CLI 自动化、ModelScope 生态
    导出能力 Web UI 一键导出到 CSGHub CLI 导出并推送到仓库

    提示

    如果您希望快速上手微调并通过可视化界面管理训练,推荐使用 LLaMA-Factory。如果您需要更灵活的 CLI 控制或使用 ModelScope 生态,推荐使用 MS-Swift