跳到主要内容

API概览

更新时间:2026-04-15

您可以通过 Baicai Infer白菜AIGC)提供的接口,使用 Baicai Infer 平台的功能。

important

调用“图生视频、首尾帧生视频、多参考图生视频、多帧生视频、AI应用”等类型的接口前,您需要先调用上传文件接口获取输入的原文件路径;调用接口之后,您可通过调用「查询任务生成结果」接口获取其生成结果。

大语言

模型名称说明
DeepSeek-R1-Distill-Qwen-1.5B调用DeepSeek-R1-Distill-Qwen-1.5B模型,基于指定的聊天对话生成模型回复。
Qwen2.5-32B-Instruct调用Qwen2.5-32B-Instruct模型,基于指定的聊天对话生成模型回复。
Qwen2.5-VL-32B-Instruct调用Qwen2.5-VL-32B-Instruct模型,基于指定的聊天对话和图像生成模型回复。
Qwen3-8B调用Qwen3-8B模型,基于指定的聊天对话生成模型回复。
Qwen3-14B调用Qwen3-14B模型,基于指定的聊天对话生成模型回复。
Qwen3-32B调用Qwen3-32B模型,基于指定的聊天对话生成模型回复。
Qwen3-30B-A3B-Instruct-2507-FP8调用Qwen3-30B-A3B-Instruct-2507-FP8模型,基于指定的聊天对话生成模型回复。

图像

【WanX】

模型名称说明
Wan 2.5
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
多图融合/单图编辑该API提供图片融合与编辑功能,支持多图融合,可将2-3张图片智能融合生成新图片;单图编辑支持对单张图片进行基于提示词的创意编辑。
Wan 2.6
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
多图融合/单图编辑该API提供图片融合与编辑功能,支持多图融合,可将2-4张图片智能融合生成新图片;单图编辑支持对单张图片进行基于提示词的创意编辑。

【可灵】

模型名称说明
可灵 O1
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
单图生图单图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。
多图生图调用该API可将2-4张图片智能融合生成新图片。
可灵 2.0
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
单图生图单图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。
多图生图调用该API可将2-4张图片智能融合生成新图片。
可灵 2.1
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
多图生图调用该API可将2-4张图片智能融合生成新图片。

【即梦】

模型名称说明
即梦 3.0
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
单图编辑图片编辑API支持对单张图片进行基于提示词的创意编辑。
即梦 3.1
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
即梦 4.0
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
单图生图单图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。
多图生图调用该API可将2-10张图片智能融合生成新图片。
即梦 4.0 Auto
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片,支持根据提示词描述决定生成图片的数量。
单图生图单图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像,支持根据提示词描述决定生成图片的数量。
多图生图调用该API可将2-10张图片智能融合生成新图片,支持根据提示词描述决定生成图片的数量。

【千问】

模型名称说明
Qwen-Image-T2I
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
Qwen-Image-I2I
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。
Qwen-Image-Edit
图片编辑图片编辑API能基于用户输入的原图为底图,在保持其整体结构和未编辑区域不变的前提下,根据文字指令对局部内容或属性进行修改。

【FLUX.X】

模型名称说明
FLUX.1-dev
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。
FLUX.1-Kontext-dev
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。
FLUX.1-schnell
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。
FLUX.2-dev
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。

【HiDream-I1】

模型名称说明
HiDream-I1-Dev
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
HiDream-I1-Fast
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
HiDream-I1-Full
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。

【HunyuanDiT】

模型名称说明
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。

【Kolors】

模型名称说明
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。

【SD3.5-Large】

模型名称说明
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。

【stable-diffusion-v1-5】

模型名称说明
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。
图生图图生图API能基于用户输入的一张图片为视觉参考,并结合文字描述,生成一张全新的、在风格、背景或构图上有所不同的图像。

【Z-Image-Turbo】

模型名称说明
文生图文生图API能基于用户输入的文字内容,生成符合语义描述的图片。

视频

提示

视频生成任务仅支持异步模式。

【WanX】

模型名称说明
Wan 2.1
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
Wan 2.2
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
Wan 2.5
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。支持生成音频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。支持生成音频。
Wan 2.6
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。支持生成音频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。支持生成音频。

【海螺】

模型名称说明
海螺 02
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
海螺 2.3
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
海螺 2.3 Fast
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。

【可灵】

模型名称说明
可灵 O1
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
可灵 2.5 Turbo
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
可灵 2.6
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。支持生成音频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。支持生成音频。

【即梦】

模型名称说明
即梦 3.0
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
即梦 3.0 Pro
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。

【拍我AI】

模型名称说明
拍我AI v4.5
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
多参考图生视频根据多参考图片生成视频,图像引用数组(1–3项)。
多帧生视频根据多关键帧图片生成视频,必须是一个包含2-7个元素的数组。
拍我AI v5
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
多参考图生视频根据多参考图片生成视频,图像引用数组(1–3项)。
多帧生视频根据多关键帧图片生成视频,必须是一个包含2-7个元素的数组。
拍我AI v5.5
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。支持生成音频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。支持生成音频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。支持生成音频。
多参考图生视频根据多参考图片生成视频,图像引用数组(1–7项)。

【Vidu】

模型名称说明
Vidu Q1
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
Vidu Q2
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
多参考图生视频根据多参考图片生成视频,图片主体信息支持1-7个主体,主体图片共1-7张。
多帧生视频根据多关键帧图片生成视频,每个任务最多9个关键帧,最少2个关键帧。
Vidu Q2 Pro
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
多参考图生视频根据多参考图片生成视频,图片主体信息支持1-7个主体,主体图片共1-7张。
多帧生视频根据多关键帧图片生成视频,每个任务最多9个关键帧,最少2个关键帧。
Vidu Q2 Pro Fast
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。

【豆包】

模型名称说明
Seedance 1.0 Pro
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
Seedance 1.0 Lite
多参考图生视频根据多参考图片生成视频,支持传入1~4张图片。
Seedance 1.5 Pro
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。
Seedance 2.0
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。支持生成音频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。支持生成音频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。支持生成音频。
多参考图生视频根据多参考图片生成视频,支持上传音频、视频等文件。
Seedance 2.0 Fast
文生视频文生视频API能基于用户输入的内容,生成符合语义描述的视频。支持生成音频。
图生视频图生视频API能基于用户输入的图片内容,生成符合语义描述的视频。支持生成音频。
首尾帧生视频首尾帧生视频API能基于用户输入的首尾帧图片,生成符合语义描述的视频。支持生成音频。
多参考图生视频根据多参考图片生成视频,支持上传音频、视频等文件。

AI应用

旅拍

模型名称说明
发起「拍照打卡」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「一句话修图」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「照片拼接」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「服饰写真」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「光影融合」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「旅拍vlog」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「卡通拍立得」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「吉卜力风格」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「婚纱照精修」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「拍立得滤镜」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「拍照姿势」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。

图片编辑

模型名称说明
发起「局部重绘」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「智能消除」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「智能扩图」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「细节修复」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「高清放大」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「智能抠图」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。

马年特辑

模型名称说明
发起「马年贺卡」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「手势舞」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「财神抱抱」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「红红火火」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「新年坐骑」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「穿越古代看花灯」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「天降男友/女友」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「企业拜年」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「萌娃拜年超可爱」任务
发起「图像合成」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「生成拜年视频」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「年夜饭团聚干杯」任务
发起「图像合成」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「生成拜年视频」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。
发起「招财萌宠拜年」任务
发起「图像合成」任务该接口用于基于已有的模板自定义节点参数,发起图片生成任务。
发起「生成拜年视频」任务该接口用于基于已有的模板自定义节点参数,发起视频生成任务。

其他任务

模型名称说明
上传文件在图生视频以及AI应用场景中,需要先调用该接口上传原始资源文件(即图片、音频、视频等)后,然后通过返回的路径作为请求参数传递给图生视频发起任务接口,才能进行发起任务处理。
查询任务状态调用该接口可以查看任务的状态。
查询任务生成结果调用该接口可以查看任务的生成结果。
取消任务调用该接口可以终止(取消)正在执行的任务。