支持的模型
Baicai Infer(白菜AIGC)平台预置了一批顶尖的生文、生图、生视频模型以及AI应用,您可以通过其提供的接口,调用这些模型,用于生文、生图、生视频或者一键创作。
- 生文模型
- 生图模型
- 生视频模型
- AI应用
| 序号 | 模型 | 说明 | 预估价格 |
|---|---|---|---|
| 1 | DeepSeek-R1-Distill-Qwen-1.5B | DeepSeek-R1-Distill-Qwen-1.5B是阿里云开源的轻量级中英双语对话模型,基于Qwen架构蒸馏优化而成。该模型仅1.5B参数量,支持单卡部署(最小显存3GB),在数学推理、代码生成等领域表现突出,适用于移动端及资源受限场景。其采用宽而不深的Transformer设计,通过强化学习提升推理能力,兼顾效率与性能平衡。 | ¥ 0.009/ 秒 |
| 2 | Qwen2.5-32B-Instruct | Qwen2.5-32B-Instruct是阿里云通义千问团队开源的大型语言模型,基于Apache 2.0协议。该模型参数量为320亿,支持长上下文(128K token),在代码生成、数学推理等任务中表现优异,可与GPT-4o相媲美。它适用于编程辅助、智能客服等场景,提供开箱即用的指令对齐版本,助力开发者高效完成复杂任务。 | ¥ 0.009/ 秒 |
| 3 | Qwen2.5-VL-32B-Instruct | Qwen2.5-VL-32B-Instruct是阿里巴巴通义千问团队于2025年开源的多模态大模型,基于Apache 2.0协议发布。该模型以32B参数实现突破性性能,支持细粒度视觉分析、复杂数学推理及结构化输出。其强化学习优化使回答更符合人类逻辑,在教育、医疗影像解析等场景表现优异,且推理成本较72B版本降低60%,成为企业级应用的理想选择。 | ¥ 0.009/ 秒 |
| 4 | Qwen3-8B | Qwen3-8B是阿里云通义千问团队开源的大型语言模型,属于Qwen3系列六款Dense模型之一,采用Apache 2.0协议。该模型参数量为80亿,支持魔搭社区、HuggingFace等平台下载及商用场景部署,原生支持32768 Token上下文长度,通过RoPE缩放技术可扩展至131072 Token,适配端侧部署场景。其具备Function Call解析、思考模式切换等功能,预训练使用36万亿token多语言数据,经知识强化等四阶段优化,可用于对话系统、RAG等应用。 | ¥ 0.009/ 秒 |
| 5 | Qwen3-32B | Qwen3-32B是阿里巴巴开源的第三代大语言模型,具备32.8B参数规模。其创新点包括GQA注意力机制、双模切换技术(思考/非思考模式),支持无缝扩展上下文至131K tokens,并在数学推理、代码生成及多语言任务中表现优异。该模型平衡性能与效率,适用于复杂逻辑处理和高效对话场景。 | ¥ 0.009/ 秒 |
| 序号 | 模型 | 任务类型 | 说明 | 预估价格 |
|---|---|---|---|---|
| 1 | FLUX.1-dev | txt2img、img2img | FLUX.1 的开发版本,主要用于图像生成与编辑的研究和测试。 | ¥ 0.045/ 图 |
| 2 | FLUX.2-dev | txt2img、img2img | FLUX.2 的开发版本,预计在图像质量、控制能力或效率上有进一步改进。 | ¥ 0.045/ 图 |
| 3 | FLUX.1-Kontext-dev | img2img | 支持上下文理解的 FLUX.1 开发版本,可能用于多轮对话或场景连贯的图像生成。 | ¥ 0.09/ 图 |
| 4 | FLUX.1-schnell | txt2img、img2img | FLUX.1 的快速版本,优化了生成速度,适合实时或批量图像生成任务。 | ¥ 0.045/ 图 |
| 5 | HiDream-I1-Dev | txt2img | 这是深度求索开发的、处于开发阶段的高性能文生图模型,具备前沿的图像生成能力。 | ¥ 0.081/ 图 |
| 6 | HiDream-I1-Full | txt2img | HiDream 模型的高质量生成模式,通过更多计算步骤产出细节更丰富、画质最优的图像,但生成速度较慢。 | ¥ 0.09/ 图 |
| 7 | HiDream-I1-Fast | txt2img | HiDream 模型的快速生成模式,通过优化计算路径实现秒级出图,在保持良好视觉效果的同时大幅提升生成速度。 | ¥ 0.081/ 图 |
| 8 | HunyuanDiT | txt2img | 基于 Diffusion Transformer 架构的混元图像生成模型,注重生成效率与质量。 | ¥ 0.027/ 图 |
| 9 | Kolors | txt2img、img2img | 一个调色或图像生成模型,专注于色彩控制。 | ¥ 0.054/ 图 |
| 10 | Qwen-lmage-T2I | txt2img | 文本到图像生成模型,根据文字描述生成对应图像。 | ¥ 0.063/ 图 |
| 11 | Qwen-lmage-I2I | img2img | 基于图像到图像的生成模型,可用于风格转换、修复、增强等任务。 | ¥ 0.063/ 图 |
| 12 | Qwen-lmage-Edit | image-edit | 专注于图像编辑的模型,支持局部修改、物体替换等功能。 | ¥ 0.27/ 图 |
| 13 | SD35-Large | txt2img、img2img | Stable Diffusion 3.5 的大规模版本,提升图像生成质量和细节表现。 | ¥ 0.27/ 图 |
| 14 | Stable Diffusion v1-5 | txt2img、img2img | Stable Diffusion系列的经典版本之一,能够根据文本提示(prompt)生成高质量的照片级图像,是AI图像生成领域的里程碑模型。 | ¥ 0.018/ 图 |
| 15 | Z-lmage-Turbo | txt2img | 一个高效轻量的图像生成模型,注重生成速度与资源占用。 | ¥ 0.081/ 图 |
| 序号 | 模型 | 说明 | 预估价格 |
|---|---|---|---|
| 1 | Wan2.1-T2V-1.3B | 文生视频,这是一个参数量较小的轻量版。 | ¥ 0.45/ 个 |
| 2 | Wan2.1-T2V-14B | 文生视频,参数量更大,效果预期更强。 | ¥ 1.8/ 个 |
| 3 | Wan2.1-T2V-14B-Fast | 上述文生视频的加速版 | ¥ 0.54/ 个 |
| 4 | Wan2.2-T2V-5B | 文生视频,Wan2.2版本的5B参数文生视频模型。 | ¥ 0.198/ 个 |
| 5 | Wan2.2-T2V-A14B | 文生视频,Wan2.2版本的另一个文生视频模型(可能架构或训练数据有差异)。 | ¥ 1.8/ 个 |
| 6 | Wan2.1-I2V-14B-480P | 图生视频,输出分辨率为480P。 | ¥ 1.98/ 个 |
| 7 | Wan2.1-I2V-14B-480P-Fast | 上述图生视频的加速版,输出分辨率为480P。 | ¥ 0.279/ 个 |
| 8 | Wan2.1-I2V-14B-720P | 图生视频,输出分辨率为720P。 | ¥ 10.8/ 个 |
| 9 | Wan2.1-I2V-14B-720P-Fast | 上述图生视频的加速版,输出分辨率为720P。 | ¥ 0.603/ 个 |
| 10 | Wan2.2-I2V-5B | 图生视频,Wan2.2版本的5B参数图生视频模型。 | ¥ 0.198/ 个 |
| 11 | Wan2.2-I2V-A14B | 图生视频,Wan2.2版本的另一个图生视频模型。 | ¥ 1.8/ 个 |
| 12 | Wan2.2-I2V-A14B-Fast | 上述图生视频的加速版。 | ¥ 0.675/ 个 |
| 13 | Wan2.1-FLF2V-14B-720P | 首尾帧生视频,输出分辨率为720P。 | ¥ 10.8/ 个 |
| 14 | Wan2.1-FLF2V-14B-720P-Fast | 上述首尾帧生视频的加速版,输出分辨率为720P。 | ¥ 6.48/ 个 |
| 序号 | 应用名称 | workflowId | 说明 | 使用场景 | 提示词 | 预估价格 |
|---|---|---|---|---|---|---|
| 1 | 拍照打卡 | photo_check_in | 将人物照片与全球旅游景点完美融合,光影自然,毫无违和感,一键实现最佳拍摄机位。上传人物照片和参考背景,输入提示词,几分钟即可生成专业级网红打卡照片! | 主题旅拍、情侣写真、亲子摄影、个人IP | “让图1人物坐在图2背景的靠垫上并面向镜头” | ¥ 0.27/ 图 |
| 2 | 一句话修图 | one_sentence_photo_editing | 简单一句话即可完成修图。上传待修图的原始照片,输入提示词指令,单击创作即可生成,实测一句话修图,运行时间在3分钟以内。 | 背景修改、物体修改、人像精修、姿势调整 支持换服装、换发型、换姿势、换背景,不仅是修图师,更是你的摄影指导 | “落日场景”,“脸转向左侧”,“换成红纱”,“换成时尚短发”,“在树干上添加一只可爱的猫咪” | ¥ 0.27/ 图 |
| 3 | 小红书爆款内容生成 | splicing_photos | 一键生成热门滤镜应用的照片,自动生成发布素材,包括标题建议和封面图。上传照片,单击创作即可生成,实测运行时间在3分钟以内。 支持爆款滤镜应用、完整素材包生成、算法优化推荐,不仅是内容生成工具,更是你的爆款助手! | 旅拍分享、美食摄影、穿搭展示、生活方式 | "生成小红书爆款旅拍图"、"打造诱人美食爆款"、"时尚穿搭爆款图"、"精致生活记录" | ¥ 0.297/ 图 |
| 4 | 服饰写真 | clothing_photography | 客户提供生活照和意向服装,生成融合照片,展示客户穿着特色服饰在特定场景中的形象。上传照片和服装,单击创作即可生成,实测运行时间在3分钟以内。 支持即时预览、真实融合、快速反馈,不仅是效果预览,更是你的决策助手! | 旅拍咨询、服装租赁、主题拍摄、团体拍摄 | "图片1中人物穿上图片2中服饰和头饰" | ¥ 0.27/ 图 |
| 5 | 光影融合 | light_and_shadow_fusion | 支持一键暖色调打光,融合目的地真实场景,提升照片质感并创造独特效果。只需上传照片并单击创作,即可快速生成理想作品。 | 旅拍风格化、真实摄影、季节风格调整、情感表达创作 | -- | ¥ 0.27/ 图 |
| 6 | 旅拍vlog | travel_memories | 基于单张照片和提示词,AI自动生成完整vlog视频,模拟最佳时刻和画面,生成适合社交媒体分享的短视频内容。上传照片并输入需求,点击运行即可生成。 支持照片生成动态回忆vlog、AI智能创作、零门槛操作,无需专业视频剪辑知识,即可快速生成理想视频内容。 | 旅拍记录、婚礼旅拍、亲子旅拍、情侣旅拍 | -- | ¥ 0.54/ 图 |
| 7 | 卡通拍立得 | cartoon_instant_camera | 一键将普通照片变化为3D可爱Q版卡通拍立得风格。只需上传照片,瞬间赋予照片萌趣十足的卡通形象与手持拍立得的独特氛围。 支持3D可爱Q版卡通风格、手持拍立得效果,让你的照片萌趣十足,轻松拍出爆款卡通大片! | 萌系自拍、卡通头像、趣味生活记录、创意社交分享 | -- | ¥ 1.017/ 图 |
| 8 | 吉卜力风格 | ghibli_style_image | 一键将普通照片变化为吉卜力动画风格拼图作品。只需上传照片,瞬间赋予照片宫崎骏动画般的治愈系色彩和温暖氛围感。 支持吉卜力动画风格转换、温暖治愈色彩、拼图艺术效果,让你的照片充满童话般的治愈感,轻松打造专属吉卜力世界! | 治愈系自拍、动漫风格头像、温暖生活记录、创意艺术分享 | -- | ¥ 1.359/ 图 |
| 9 | 婚纱照精修 | wedding_photo_retouching | 专业AI婚纱摄影精修工具,一键实现婚纱照光影优化和精修调色。智能识别婚纱细节,精准调整光影商业质感婚照大片。 支持商业级光影重塑、外景氛围调色,让你的婚纱照达到专业摄影工作室水准! | 婚纱摄影工作室、婚礼摄影、外景婚纱拍摄、商业广告拍摄、高端定制婚照 | -- | ¥ 1.656/ 图 |
| 10 | 拍立得滤镜 | instant_camera_filter | 一键将普通照片转化为具有复古质感的拍立得撕拉胶片滤镜效果。只需上传照片,瞬间赋予照片经典拍立得的温暖色调和怀旧胶片质感。 支持拍立得撕拉胶片滤镜、复古温暖色调、胶片颗粒质感,让你的照片充满怀旧情怀,轻松打造专属复古拍立得大片! | 复古自拍、胶片风格头像、怀旧生活记录、创意摄影分享 | -- | ¥ 1.044/ 图 |
| 11 | 拍照姿势 | photo_pose | 上传原始照片和参考姿势照片,一键自动变换小红书爆款生命力拍照姿势,告别剪刀手尴尬,轻松拍出高赞大片! 爆款拍照姿势优化,让你的照片更有生命力,轻松拍出高赞大片! | 旅拍分享、穿搭展示、精致生活记录 | -- | 1.647/ 图 |