跳到主要内容

文生图

更新时间:2026-01-12 11:26:20
文生图API能基于用户输入的内容,生成符合语义描述的图片。
POST
https://cloud.baicaiinfer.com/v1/images/generations
Authorizations
AuthorizationsStringHeaderRequired

用户需使用已获取的API Key进行身份验证,以访问服务。

Body
application/json
selected_modelStringRequired

模型名称,选择Stable Diffusion v1-5 。更多模型,可参考支持的模型

task_typeEnumerateRequired

指定生成式模型需执行的任务类型,目前仅支持“txt2img”。更多模型,可参考支持的模型

user_idStringRequired

发起请求的用户ID。

response_formatEnumerateRequired

允许强制模型产生特定的输出格式,示例:url、b64_json。

inputStructRequired

生成式模型(如图像生成)的核心参数集合,包含prompt(正向提示词)、negative_prompt(反向提示词)、width/height(尺寸)等具体配置,用于定义生成内容的细节和规则。

input.promptStringRequired

是生成图像时用于描述期望内容(如场景、风格、细节等)的正向提示词,指导模型生成符合需求的图像。

input.negative_promptString

用于指定生成图像时需避免的元素(如低质量、失真等)的反向提示词,以优化生成结果的质量。

input.widthIntRequired

指定生成图像的宽度,单位通常为像素,用于定义输出图像在水平方向上的尺寸,示例:1024。

input.heightintegerRequired

指定生成视频的高度,单位通常为像素,用于定义输出图像在垂直方向上的尺寸,示例:480。1. 若直接提供了 width(宽度)和 height(高度)的具体像素值,系统将直接采用此设定(如果不满足16倍数,会相应自动调整);2. 若未直接指定宽高,但同时提供了 resolution 和 aspect_ratio ,系统将根据这两者自动计算出对应的宽高值。例如 16:9 + 720p,计算结果为 1280*720;如9:16 + 720p,计算结果为 720*1280;3. 若只提供了 resolution ,没有 aspect_ratio,则默认按照 16:9 来计算;4. 若同时提供了width、 height、resolution、aspect_ratio,优先使用width、 height值。

input.aspect_ratioIntRequired

指定生成图像的宽高比(1:1、2:3、3:4、4:3、9:16、16:9、自定义)。

input.resolutionintegerRequired

分辨率(1K、2K、4K)。

input.guidance_scaleFloat

控制生成内容与input.prompt(正向提示词)的契合度,值越高生成内容越贴近提示词,但可能降低图像自然度;值越低则模型创造力越强,但可能偏离需求,示例:7.5。

input.number_of_imagesInt

指定生成图像的数量,用于控制一次请求返回的图片总数,示例:1,不传,则默认生成一张图片。

input.num_inference_stepsInt

指定生成模型迭代优化的次数,次数越多生成图像细节越精细、质量越高,但同时会增加生成耗时,示例:28。

input.stepFloatRequired

迭代步数影响图片质量与时长:步数少速度快质量低;步数多速度慢质量高。20~30 步可生成高质量,40 步以上用于高精度场景,示例:20。

input.true_cfg_scaleInt

一种优化后的提示词引导,相比普通guidance_scale能更精准控制生成内容与提示词的契合度,减少过度引导导致的图像失真问题。当true_cfg_scale 大于1且提供了negative_prompt时,真正的无分类器引导(引导尺度)将被启用,示例:9.0。

need_expand_promptBoolean

优化提示词。

Response
状态码:application/json
codeString Required

表示请求处理状态的状态码。

0是成功标识,表示接口正常返回预期结果。
messageStringRequired

返回请求的处理结果,通常配合状态码使用,直观告知用户当前请求的具体情况。

dataobjectRequired

任务的核心结果数据。

data.taskIdStringRequired

任务的唯一标识ID。

data.statusStringRequired

任务的执行状态,包括:PENDING、PROCESSING、COMPLETED、FAILED、CANCELED、UNKNOWN。

data.progressStringRequired

任务完成进度,包括:排队中、生成中、已完成、已失败、用户主动取消、未知,对于taskId不存在时返回此状态,与status参数值一一对应。

resultobjectRequired

任务返回的结果。

result.imagesString

是图像文件经Base64编码后的字符串,需解码后才能还原为图像数据,适合无法直接访问外部链接(如内网环境)或需要本地直接处理图像的场景。

result.urlsString

是生成图片的网络访问链接,通过该URL可直接下载或在线查看图片文件,适合需要快速预览或通过链接分享的场景。

tsStringRequired

响应的时间戳。

curl --location --request POST 'https://cloud.baicaiinfer.com/v1/images/generations' \
--header 'Authorization: Bearer sk-5p1zwaivq2bRCfF08Vm*****' \
--header 'Content-Type: application/json' \
--data-raw '{
    "selected_model": "Stable Diffusion v1-5	",
    "task_type": "txt2img",
    "user_id":"04527f5b186a4b3587863399402*****",
    "response_format":"url",
    "input": {
        "prompt": "a beautiful young woman, realistic face, detailed eyes, soft natural lighting, high-resolution portrait, 8K, ultra-detailed skin texture, cinematic lighting, professional photography, sharp focus",
        "negative_prompt": "blurry, low quality, low resolution, cartoon, anime, painting, illustration, distorted face, bad proportions, extra limbs, unrealistic, overexposed, underexposed, noisy",
        "width": 1024,
        "height": 1024,
        "guidance_scale": 1,
        "number_of_images": 1,
        "num_inference_steps": 35,
        "step": 20,
        "true_cfg_scale": 3.5
    }
}'
// 以url格式输出的结果:
{
    "code": 0,
    "message": "查询成功",
    "data": [
        {
            "taskId": "5a5bd4226a574a02aad62b7a001*****",
            "status": "COMPLETED",
            "progress": "已完成",
            "result": {
                "urls": [
                    "https://s1.llamafactory.online/baicai-infer/results/5a5bd4226a574a02aad62b7a001*****/28613d906e2d4600ac7547fe879906a7.png"
                ]
            }
        }
    ],
    "ts": "2026-01-12T17:03:15.119028038+08:00[Asia/Shanghai]"
}

// 以b64_json格式输出的结果:
{
    "code": 0,
    "message": "查询成功",
    "data": [
      {
            "taskId": "5a5bd4226a574a02aad62b7a001*****",
            "status": "COMPLETED",
            "progress": "已完成",
            "result": {
                "images":["iVBORw0KGgoAAAANSUhEUgAABAAAAAQACAIAAADwf7zUAAEAAElEQVR4nJz92ZIkSZIlivEmompmvkVkZm09d+4QMHRfgF/BI/DpoCECLu5sXV2VGRnh4W6LqggveGBRM/OoagIRvLuzw83N1HSR5fDhw4fx//Z//3+0te32cwSadUBwD0SE8YMRQYRujrS9iAgREQAIEAGIbpYvIiEheQSOtwEiAgQghrtHRAAimFoeA4kgjwOIiHlECL9+UXgAYkREBCJEOAICQgTk2QREuEcAQpi5mUZEb6ubmylEqOl2GpDfFOEA4GYAqL0TU++KECJCSADh7tp7hJtZeLgZILgbBARAuJu7m0WEx+0HAFXVzMzs7kXYbhQE3H7yT3kB/+QH7/8VkBf8/8fP9mkAGt+Ux8F//r1IFBHXz9yd33YB1w/e3c9/PNZ45Pjx1ftrDkAkRPTxdTmQCLZjhwfkkx6vYB42j4kAwoIIiKimAOAR4TaJCFMVJsIIRwAHQMRA1KYsfFkaAJRatXdAVDUiEhFEaG1FpOs4dLcxVsKnOpVSWmvMeX+wt7bfH4R5XZd1bXU3rWtvqg8PD5fLORDcgJjCnBARggAQARGYkJCYmJh67wHh7jmgWTg8CCH/l4nyFoWHQxBAQOQcy9ODyCdGeRBidofjZUGAwzzV
        ],
                "urls": [
                  "https://llamafactory-online-assets.oss-cn-beijing.aliyuncs.com/baicai-infer/users/123456/output/356d8358150a42f09a47322baf66e97d.png"
                ]
            }
       
        
       }
    ],
    "ts": "2026-01-12T17:03:15.119028038+08:00[Asia/Shanghai]"
}