API概览

更新时间：2026-04-15

您可以通过 Baicai Infer（白菜AIGC）提供的接口，使用 Baicai Infer 平台的功能。

important

调用“图生视频、首尾帧生视频、多参考图生视频、多帧生视频、AI应用”等类型的接口前，您需要先调用上传文件接口获取输入的原文件路径；调用接口之后，您可通过调用「查询任务生成结果」接口获取其生成结果。

大语言

模型名称	说明
DeepSeek-R1-Distill-Qwen-1.5B	调用DeepSeek-R1-Distill-Qwen-1.5B模型，基于指定的聊天对话生成模型回复。
Qwen2.5-32B-Instruct	调用Qwen2.5-32B-Instruct模型，基于指定的聊天对话生成模型回复。
Qwen2.5-VL-32B-Instruct	调用Qwen2.5-VL-32B-Instruct模型，基于指定的聊天对话和图像生成模型回复。
Qwen3-8B	调用Qwen3-8B模型，基于指定的聊天对话生成模型回复。
Qwen3-14B	调用Qwen3-14B模型，基于指定的聊天对话生成模型回复。
Qwen3-32B	调用Qwen3-32B模型，基于指定的聊天对话生成模型回复。
Qwen3-30B-A3B-Instruct-2507-FP8	调用Qwen3-30B-A3B-Instruct-2507-FP8模型，基于指定的聊天对话生成模型回复。

图像

【WanX】

模型名称	说明
Wan 2.5
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
多图融合/单图编辑	该API提供图片融合与编辑功能，支持多图融合，可将2-3张图片智能融合生成新图片；单图编辑支持对单张图片进行基于提示词的创意编辑。
Wan 2.6
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
多图融合/单图编辑	该API提供图片融合与编辑功能，支持多图融合，可将2-4张图片智能融合生成新图片；单图编辑支持对单张图片进行基于提示词的创意编辑。

【可灵】

模型名称	说明
可灵 O1
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
单图生图	单图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。
多图生图	调用该API可将2-4张图片智能融合生成新图片。
可灵 2.0
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
单图生图	单图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。
多图生图	调用该API可将2-4张图片智能融合生成新图片。
可灵 2.1
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
多图生图	调用该API可将2-4张图片智能融合生成新图片。

【即梦】

模型名称	说明
即梦 3.0
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
单图编辑	图片编辑API支持对单张图片进行基于提示词的创意编辑。
即梦 3.1
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
即梦 4.0
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
单图生图	单图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。
多图生图	调用该API可将2-10张图片智能融合生成新图片。
即梦 4.0 Auto
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片，支持根据提示词描述决定生成图片的数量。
单图生图	单图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像，支持根据提示词描述决定生成图片的数量。
多图生图	调用该API可将2-10张图片智能融合生成新图片，支持根据提示词描述决定生成图片的数量。

【千问】

模型名称	说明
Qwen-Image-T2I
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
Qwen-Image-I2I
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。
Qwen-Image-Edit
图片编辑	图片编辑API能基于用户输入的原图为底图，在保持其整体结构和未编辑区域不变的前提下，根据文字指令对局部内容或属性进行修改。

【FLUX.X】

模型名称	说明
FLUX.1-dev
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。
FLUX.1-Kontext-dev
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。
FLUX.1-schnell
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。
FLUX.2-dev
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。

【HiDream-I1】

模型名称	说明
HiDream-I1-Dev
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
HiDream-I1-Fast
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
HiDream-I1-Full
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。

【HunyuanDiT】

模型名称	说明
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。

【Kolors】

模型名称	说明
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。

【SD3.5-Large】

模型名称	说明
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。

【stable-diffusion-v1-5】

模型名称	说明
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。
图生图	图生图API能基于用户输入的一张图片为视觉参考，并结合文字描述，生成一张全新的、在风格、背景或构图上有所不同的图像。

【Z-Image-Turbo】

模型名称	说明
文生图	文生图API能基于用户输入的文字内容，生成符合语义描述的图片。

视频

提示

视频生成任务仅支持异步模式。

【WanX】

模型名称	说明
Wan 2.1
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
Wan 2.2
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
Wan 2.5
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。支持生成音频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。支持生成音频。
Wan 2.6
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。支持生成音频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。支持生成音频。

【海螺】

模型名称	说明
海螺 02
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
海螺 2.3
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
海螺 2.3 Fast
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。

【可灵】

模型名称	说明
可灵 O1
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
可灵 2.5 Turbo
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
可灵 2.6
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。支持生成音频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。支持生成音频。

【即梦】

模型名称	说明
即梦 3.0
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
即梦 3.0 Pro
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。

【拍我AI】

模型名称	说明
拍我AI v4.5
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
多参考图生视频	根据多参考图片生成视频，图像引用数组（1–3项）。
多帧生视频	根据多关键帧图片生成视频，必须是一个包含2-7个元素的数组。

拍我AI v5
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
多参考图生视频	根据多参考图片生成视频，图像引用数组（1–3项）。
多帧生视频	根据多关键帧图片生成视频，必须是一个包含2-7个元素的数组。
拍我AI v5.5
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。支持生成音频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。支持生成音频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。支持生成音频。
多参考图生视频	根据多参考图片生成视频，图像引用数组（1–7项）。

【Vidu】

模型名称	说明
Vidu Q1
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
Vidu Q2
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
多参考图生视频	根据多参考图片生成视频，图片主体信息支持1-7个主体，主体图片共1-7张。
多帧生视频	根据多关键帧图片生成视频，每个任务最多9个关键帧，最少2个关键帧。

Vidu Q2 Pro
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
多参考图生视频	根据多参考图片生成视频，图片主体信息支持1-7个主体，主体图片共1-7张。
多帧生视频	根据多关键帧图片生成视频，每个任务最多9个关键帧，最少2个关键帧。
Vidu Q2 Pro Fast
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。

【豆包】

模型名称	说明
Seedance 1.0 Pro
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
Seedance 1.0 Lite
多参考图生视频	根据多参考图片生成视频，支持传入1～4张图片。
Seedance 1.5 Pro
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。
Seedance 2.0
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。支持生成音频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。支持生成音频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。支持生成音频。
多参考图生视频	根据多参考图片生成视频，支持上传音频、视频等文件。
Seedance 2.0 Fast
文生视频	文生视频API能基于用户输入的内容，生成符合语义描述的视频。支持生成音频。
图生视频	图生视频API能基于用户输入的图片内容，生成符合语义描述的视频。支持生成音频。
首尾帧生视频	首尾帧生视频API能基于用户输入的首尾帧图片，生成符合语义描述的视频。支持生成音频。
多参考图生视频	根据多参考图片生成视频，支持上传音频、视频等文件。

AI应用

旅拍

模型名称	说明
发起「拍照打卡」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「一句话修图」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「照片拼接」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「服饰写真」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「光影融合」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「旅拍vlog」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「卡通拍立得」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「吉卜力风格」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「婚纱照精修」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「拍立得滤镜」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「拍照姿势」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。

图片编辑

模型名称	说明
发起「局部重绘」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「智能消除」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「智能扩图」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「细节修复」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「高清放大」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「智能抠图」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。

马年特辑

模型名称	说明
发起「马年贺卡」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「手势舞」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「财神抱抱」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「红红火火」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「新年坐骑」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「穿越古代看花灯」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「天降男友/女友」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「企业拜年」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「萌娃拜年超可爱」任务
发起「图像合成」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「生成拜年视频」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「年夜饭团聚干杯」任务
发起「图像合成」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「生成拜年视频」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。
发起「招财萌宠拜年」任务
发起「图像合成」任务	该接口用于基于已有的模板自定义节点参数，发起图片生成任务。
发起「生成拜年视频」任务	该接口用于基于已有的模板自定义节点参数，发起视频生成任务。

其他任务

模型名称	说明
上传文件	在图生视频以及AI应用场景中，需要先调用该接口上传原始资源文件（即图片、音频、视频等）后，然后通过返回的路径作为请求参数传递给图生视频或发起任务接口，才能进行发起任务处理。
查询任务状态	调用该接口可以查看任务的状态。
查询任务生成结果	调用该接口可以查看任务的生成结果。
取消任务	调用该接口可以终止（取消）正在执行的任务。