跳到主要内容

支持的模型

更新时间:2025-11-24 13:43:12

本文介绍 Baicai Infer白菜AIGC)平台支持的生文和生图模型。

支持的基础模型

序号模型说明
1Qwen2.5-32B-InstructQwen2.5-32B-Instruct是阿里云通义千问团队开源的大型语言模型,基于Apache 2.0协议。该模型参数量为320亿,支持长上下文(128K token),在代码生成、数学推理等任务中表现优异,可与GPT-4o相媲美。它适用于编程辅助、智能客服等场景,提供开箱即用的指令对齐版本,助力开发者高效完成复杂任务。
2Qwen2.5-VL-32B-InstructQwen2.5-VL-32B-Instruct是阿里巴巴通义千问团队于2025年开源的多模态大模型,基于Apache 2.0协议发布。该模型以32B参数实现突破性性能,支持细粒度视觉分析、复杂数学推理及结构化输出。其强化学习优化使回答更符合人类逻辑,在教育、医疗影像解析等场景表现优异,且推理成本较72B版本降低60%,成为企业级应用的理想选择。
3Qwen3-32BQwen3-32B是阿里巴巴开源的第三代大语言模型,具备32.8B参数规模。其创新点包括GQA注意力机制、双模切换技术(思考/非思考模式),支持无缝扩展上下文至131K tokens,并在数学推理、代码生成及多语言任务中表现优异。该模型平衡性能与效率,适用于复杂逻辑处理和高效对话场景。
4DeepSeek-R1-Distill-Qwen-1.5BDeepSeek-R1-Distill-Qwen-1.5B是阿里云开源的轻量级中英双语对话模型,基于Qwen架构蒸馏优化而成。该模型仅1.5B参数量,支持单卡部署(最小显存3GB),在数学推理、代码生成等领域表现突出,适用于移动端及资源受限场景。其采用宽而不深的Transformer设计,通过强化学习提升推理能力,兼顾效率与性能平衡。
5Qwen3-8BQwen3-8B是阿里云通义千问团队开源的大型语言模型,属于Qwen3系列六款Dense模型之一,采用Apache 2.0协议。该模型参数量为80亿,支持魔搭社区、HuggingFace等平台下载及商用场景部署,原生支持32768 Token上下文长度,通过RoPE缩放技术可扩展至131072 Token,适配端侧部署场景。其具备Function Call解析、思考模式切换等功能,预训练使用36万亿token多语言数据,经知识强化等四阶段优化,可用于对话系统、RAG等应用。