跳到主要内容

支持的模型

更新时间：2025-11-24 13:43:12

本文介绍 Baicai Infer（白菜AIGC）平台支持的生文和生图模型。

支持的基础模型

生文模型
生图模型

序号	模型	说明
1	Qwen2.5-32B-Instruct	Qwen2.5-32B-Instruct是阿里云通义千问团队开源的大型语言模型，基于Apache 2.0协议。该模型参数量为320亿，支持长上下文（128K token），在代码生成、数学推理等任务中表现优异，可与GPT-4o相媲美。它适用于编程辅助、智能客服等场景，提供开箱即用的指令对齐版本，助力开发者高效完成复杂任务。
2	Qwen2.5-VL-32B-Instruct	Qwen2.5-VL-32B-Instruct是阿里巴巴通义千问团队于2025年开源的多模态大模型，基于Apache 2.0协议发布。该模型以32B参数实现突破性性能，支持细粒度视觉分析、复杂数学推理及结构化输出。其强化学习优化使回答更符合人类逻辑，在教育、医疗影像解析等场景表现优异，且推理成本较72B版本降低60%，成为企业级应用的理想选择。
3	Qwen3-32B	Qwen3-32B是阿里巴巴开源的第三代大语言模型，具备32.8B参数规模。其创新点包括GQA注意力机制、双模切换技术（思考/非思考模式），支持无缝扩展上下文至131K tokens，并在数学推理、代码生成及多语言任务中表现优异。该模型平衡性能与效率，适用于复杂逻辑处理和高效对话场景。
4	DeepSeek-R1-Distill-Qwen-1.5B	DeepSeek-R1-Distill-Qwen-1.5B是阿里云开源的轻量级中英双语对话模型，基于Qwen架构蒸馏优化而成。该模型仅1.5B参数量，支持单卡部署（最小显存3GB），在数学推理、代码生成等领域表现突出，适用于移动端及资源受限场景。其采用宽而不深的Transformer设计，通过强化学习提升推理能力，兼顾效率与性能平衡。
5	Qwen3-8B	Qwen3-8B是阿里云通义千问团队开源的大型语言模型，属于Qwen3系列六款Dense模型之一，采用Apache 2.0协议。该模型参数量为80亿，支持魔搭社区、HuggingFace等平台下载及商用场景部署，原生支持32768 Token上下文长度，通过RoPE缩放技术可扩展至131072 Token，适配端侧部署场景。其具备Function Call解析、思考模式切换等功能，预训练使用36万亿token多语言数据，经知识强化等四阶段优化，可用于对话系统、RAG等应用。

序号	模型	说明
1	FLUX.1-schnell	FLUX.1-schnell是Black Forest Labs开发的文本到图像生成模型，含120亿参数。它采用潜在对抗扩散蒸馏技术训练，仅需1-4步即可生成高质量图像，输出效果媲美闭源方案。该模型支持Apache 2.0开源协议，适用于个人、科研和商业场景，在艺术创作、游戏设计等领域表现突出。
2	sd35-large	Stable Diffusion 3.5 Large是一款多模态扩散 Transformer（MMDiT）文本到图像模型，它在图像质量、排版、复杂提示理解以及资源效率方面均有性能提升。
3	Qwen-Image	Qwen-Image是通义千问系列中的一个图像生成基础模型，在复杂文本渲染和精确图像编辑方面取得了重大进展。实验表明，该模型在图像生成和编辑方面都具备强大的通用能力，在文本渲染（尤其是中文文本渲染）方面表现尤为出色。
4	FLUX.1-dev	FLUX.1-dev是Black Forest Labs开发的先进文本到图像生成模型，基于120亿参数的Rectified Flow Transformer架构。它融合多模态扩散与Transformer模块，采用双编码器（T5+CLIP）提取语义信息，并引入RoPE位置编码优化空间感知。该模型支持高分辨率输出和风格多样化创作，在细节还原、提示遵从性及生成效率上表现突出，适用于数字艺术、工业设计等领域。

支持的基础模型