doubao-seedream-5.0-lite 多图融合 API 使用文档
基于字节跳动 Seedream 5.0 lite 模型的多图融合接口,通过 DMXAPI /v1/responses 端点调用。一次可传入 2~14 张参考图 + 文本提示词,将多张图片的主体、风格或场景融合生成一组新图,适用于人物换装、场景合成、风格混合、商品展示等场景。支持 2K / 3K / 4K 三档分辨率、组图批量生成(输入参考图数量 + 生成图片数量 ≤ 15)、联网搜索增强(tools: web_search)、自定义输出格式(png / jpeg)与流式输出。
接口地址
| 接口 | 请求方式 | URL |
|---|---|---|
| 多图融合 | POST | https://www.dmxapi.cn/v1/responses |
WARNING
请妥善保管您的 API Key!严禁将密钥泄露给他人、硬编码到代码中或提交到公开的代码仓库。如果怀疑密钥已泄露,请立即前往 DMXAPI 官网重新生成。
模型名称
doubao-seedream-5.0-lite
多图融合 示例代码
python
import requests
import json
# ===============================================================
# 步骤1: 配置 API 连接信息
# ===============================================================
# DMXAPI 服务端点地址
url = "https://www.dmxapi.cn/v1/responses"
# DMXAPI 密钥 (请替换为您自己的密钥)
# 获取方式: 登录 DMXAPI 官网 -> 个人中心 -> API 密钥管理
api_key = "sk-***********************************************"
# ===============================================================
# 步骤2: 配置请求头
# ===============================================================
headers = {
"Content-Type": "application/json", # 指定请求体为 JSON 格式
"Authorization": f"{api_key}", # token 认证方式
}
# ===============================================================
# 步骤3: 配置请求参数
# ===============================================================
payload = {
# 【model】(string, 必填) 您需要调用的模型 ID
"model": "doubao-seedream-5.0-lite",
# 【input】(string, 必填) 用于生成图像的提示词,支持中英文
# 建议不超过 300 个汉字或 600 个英文单词;字数过多信息容易分散,
# 模型可能因此忽略细节、只关注重点,造成图片缺失部分元素
"input": "保持模特姿势和液态服装的流动形状不变。将服装材质从银色金属改为完全透明的清水(或玻璃),生成3张图片",
# 【image】(string/array, 条件必填) 输入的图片信息,支持 URL 或 Base64 编码
# 多图融合场景传入图片数组(2~14 张);doubao-seedream-5.0-lite 最多支持传入 14 张参考图
# 图片 URL:请确保图片 URL 可被访问
# Base64 编码:格式为 data:image/<图片格式>;base64,<Base64编码>
# 注意 <图片格式> 需小写,如 data:image/png;base64,<base64_image>
# 每张图片需满足以下条件:
# 图片格式:jpeg、png、webp、bmp、tiff、gif、heic、heif
# 宽高比(宽/高)范围:[1/16, 16]
# 宽高长度(px)> 14
# 大小:不超过 30MB
# 总像素:不超过 6000x6000=36000000 px
# (对单张图宽度和高度的像素乘积限制,而非对宽度或高度单独限制)
"image": [
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimage_1.png",
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_5_imagesToimage_2.png"
],
# 【size】(string, 可选) 指定生成图像的尺寸信息,支持以下两种方式,不可混用
# 方式 1 | 指定分辨率,并在 input 提示词中用自然语言描述宽高比/形状/用途,由模型判断具体大小
# 可选值:2K、3K、4K
# 方式 2 | 指定宽高像素值,默认值 2048x2048,需同时满足:
# 总像素取值范围:[2560x1440=3686400, 4096x4096=16777216]
# 宽高比取值范围:[1/16, 16]
# 说明:总像素是对单张图宽度和高度的像素乘积限制,而非对宽度或高度单独限制
# 有效示例 3750x1250:总像素 3750x1250=4687500 符合 [3686400, 16777216],
# 宽高比 3750/1250=3 符合 [1/16, 16],故有效
# 无效示例 1500x1500:总像素 1500x1500=2250000 未达到 3686400 最低要求,
# 虽宽高比 1 符合范围,但未同时满足两项限制,故无效
# 推荐的宽高像素值:
# 2K | 1:1=2048x2048 4:3=2304x1728 3:4=1728x2304 16:9=2848x1600
# | 9:16=1600x2848 3:2=2496x1664 2:3=1664x2496 21:9=3136x1344
# 3K | 1:1=3072x3072 4:3=3456x2592 3:4=2592x3456 16:9=4096x2304
# | 9:16=2304x4096 3:2=3744x2496 2:3=2496x3744 21:9=4704x2016
# 4K | 1:1=4096x4096 4:3=4704x3520 3:4=3520x4704 16:9=5504x3040
# | 9:16=3040x5504 3:2=4992x3328 2:3=3328x4992 21:9=6240x2656
"size": "2K",
# 【sequential_image_generation】(string, 可选) 控制是否开启组图功能,默认值 disabled
# 组图:基于您输入的内容,生成的一组内容关联的图片
# auto:自动判断模式,模型根据提示词自主判断是否返回组图以及组图包含的图片数量
# disabled:关闭组图功能,模型只会生成一张图
"sequential_image_generation": "auto",
# 【sequential_image_generation_options】(object, 可选) 组图功能的配置,仅当 sequential_image_generation 为 auto 时生效
"sequential_image_generation_options": {
# 【max_images】(integer, 可选) 指定本次请求最多可生成的图片数量,默认值 15,取值范围 [1, 15]
# 实际可生成的图片数量除受 max_images 影响外,还受输入参考图数量影响:
# 输入的参考图数量 + 最终生成的图片数量 ≤ 15 张
"max_images": 15
},
# 【tools】(array of object, 可选) 配置模型要调用的工具
"tools": [{
# 【tools.type】(string, 可选) 指定使用的工具类型
# web_search:联网搜索功能,开启后模型根据提示词自主判断是否搜索互联网内容(如商品、天气等),
# 提升生成图片的时效性,但也会增加一定的时延
# 实际搜索次数可通过返回字段 usage.tool_usage.web_search 查询,为 0 表示未搜索
"type": "web_search"
}],
# 【stream】(boolean, 可选) 控制是否开启流式输出模式,默认值 false
# false:非流式输出,等待所有图片全部生成结束后再一次性返回所有信息
# true:流式输出,即时返回每张图片输出的结果;在生成单图和组图场景下均生效
"stream": False,
# 【output_format】(string, 可选) 指定生成图像的文件格式,默认值 jpeg
# 可选值:png、jpeg
"output_format": "png",
# 【response_format】(string, 可选) 指定生成图像的返回格式,默认值 url
# url:返回图片下载链接,链接在图片生成后 24 小时内有效,请及时下载图片
# b64_json:以 Base64 编码字符串的 JSON 格式返回图像数据
"response_format": "url",
# 【watermark】(boolean, 可选) 是否在生成的图片中添加水印,默认值 true
# false:不添加水印
# true:在图片右下角添加"AI生成"字样的水印标识
"watermark": False,
# 【optimize_prompt_options】(object, 可选) 提示词优化功能的配置
"optimize_prompt_options": {
# 【optimize_prompt_options.mode】(string, 可选) 设置提示词优化功能使用的模式,默认值 standard
# standard:标准模式,生成内容的质量更高,耗时较长
# fast:快速模式,生成内容的耗时更短,质量一般;当前 doubao-seedream-5.0-lite 不支持
"mode": "standard"
}
}
# ===============================================================
# 步骤4: 发送请求并输出结果
# ===============================================================
# 发送 POST 请求到 API 服务器
response = requests.post(url, headers=headers, json=payload)
# 格式化输出 JSON 响应
# - indent=2: 缩进 2 空格,便于阅读
# - ensure_ascii=False: 正确显示中文字符
print(json.dumps(response.json(), indent=2, ensure_ascii=False))python
import requests
import json
# ===============================================================
# 步骤1: 配置 API 连接信息
# ===============================================================
# DMXAPI 服务端点地址
url = "https://www.dmxapi.cn/v1/responses"
# DMXAPI 密钥 (请替换为您自己的密钥)
# 获取方式: 登录 DMXAPI 官网 -> 个人中心 -> API 密钥管理
api_key = "sk-***********************************************"
# ===============================================================
# 步骤2: 配置请求头
# ===============================================================
headers = {
"Content-Type": "application/json", # 指定请求体为 JSON 格式
"Authorization": f"{api_key}", # token 认证方式
}
# ===============================================================
# 步骤3: 配置请求参数
# ===============================================================
payload = {
# 【model】(string, 必填) 您需要调用的模型 ID
"model": "doubao-seedream-5.0-lite",
# 【input】(string, 必填) 用于生成图像的提示词,支持中英文
# 建议不超过 300 个汉字或 600 个英文单词;字数过多信息容易分散,
# 模型可能因此忽略细节、只关注重点,造成图片缺失部分元素
"input": "保持模特姿势和液态服装的流动形状不变。将服装材质从银色金属改为完全透明的清水(或玻璃),生成3张图片",
# 【image】(string/array, 条件必填) 输入的图片信息,支持 URL 或 Base64 编码
# 多图融合场景传入图片数组(2~14 张);doubao-seedream-5.0-lite 最多支持传入 14 张参考图
# 图片 URL:请确保图片 URL 可被访问
# Base64 编码:格式为 data:image/<图片格式>;base64,<Base64编码>
# 注意 <图片格式> 需小写,如 data:image/png;base64,<base64_image>
# 每张图片需满足以下条件:
# 图片格式:jpeg、png、webp、bmp、tiff、gif、heic、heif
# 宽高比(宽/高)范围:[1/16, 16]
# 宽高长度(px)> 14
# 大小:不超过 30MB
# 总像素:不超过 6000x6000=36000000 px
# (对单张图宽度和高度的像素乘积限制,而非对宽度或高度单独限制)
"image": [
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_imagesToimage_1.png",
"https://ark-project.tos-cn-beijing.volces.com/doc_image/seedream4_5_imagesToimage_2.png"
],
# 【size】(string, 可选) 指定生成图像的尺寸信息,支持以下两种方式,不可混用
# 方式 1 | 指定分辨率,并在 input 提示词中用自然语言描述宽高比/形状/用途,由模型判断具体大小
# 可选值:2K、3K、4K
# 方式 2 | 指定宽高像素值,默认值 2048x2048,需同时满足:
# 总像素取值范围:[2560x1440=3686400, 4096x4096=16777216]
# 宽高比取值范围:[1/16, 16]
# 说明:总像素是对单张图宽度和高度的像素乘积限制,而非对宽度或高度单独限制
# 有效示例 3750x1250:总像素 3750x1250=4687500 符合 [3686400, 16777216],
# 宽高比 3750/1250=3 符合 [1/16, 16],故有效
# 无效示例 1500x1500:总像素 1500x1500=2250000 未达到 3686400 最低要求,
# 虽宽高比 1 符合范围,但未同时满足两项限制,故无效
# 推荐的宽高像素值:
# 2K | 1:1=2048x2048 4:3=2304x1728 3:4=1728x2304 16:9=2848x1600
# | 9:16=1600x2848 3:2=2496x1664 2:3=1664x2496 21:9=3136x1344
# 3K | 1:1=3072x3072 4:3=3456x2592 3:4=2592x3456 16:9=4096x2304
# | 9:16=2304x4096 3:2=3744x2496 2:3=2496x3744 21:9=4704x2016
# 4K | 1:1=4096x4096 4:3=4704x3520 3:4=3520x4704 16:9=5504x3040
# | 9:16=3040x5504 3:2=4992x3328 2:3=3328x4992 21:9=6240x2656
"size": "2K",
# 【sequential_image_generation】(string, 可选) 控制是否开启组图功能,默认值 disabled
# 组图:基于您输入的内容,生成的一组内容关联的图片
# auto:自动判断模式,模型根据提示词自主判断是否返回组图以及组图包含的图片数量
# disabled:关闭组图功能,模型只会生成一张图
"sequential_image_generation": "auto",
# 【sequential_image_generation_options】(object, 可选) 组图功能的配置,仅当 sequential_image_generation 为 auto 时生效
"sequential_image_generation_options": {
# 【max_images】(integer, 可选) 指定本次请求最多可生成的图片数量,默认值 15,取值范围 [1, 15]
# 实际可生成的图片数量除受 max_images 影响外,还受输入参考图数量影响:
# 输入的参考图数量 + 最终生成的图片数量 ≤ 15 张
"max_images": 15
},
# 【tools】(array of object, 可选) 配置模型要调用的工具
"tools": [{
# 【tools.type】(string, 可选) 指定使用的工具类型
# web_search:联网搜索功能,开启后模型根据提示词自主判断是否搜索互联网内容(如商品、天气等),
# 提升生成图片的时效性,但也会增加一定的时延
# 实际搜索次数可通过返回字段 usage.tool_usage.web_search 查询,为 0 表示未搜索
"type": "web_search"
}],
# 【stream】(boolean, 可选) 控制是否开启流式输出模式,默认值 false
# false:非流式输出,等待所有图片全部生成结束后再一次性返回所有信息
# true:流式输出,即时返回每张图片输出的结果;在生成单图和组图场景下均生效
"stream": True,
# 【output_format】(string, 可选) 指定生成图像的文件格式,默认值 jpeg
# 可选值:png、jpeg
"output_format": "png",
# 【response_format】(string, 可选) 指定生成图像的返回格式,默认值 url
# url:返回图片下载链接,链接在图片生成后 24 小时内有效,请及时下载图片
# b64_json:以 Base64 编码字符串的 JSON 格式返回图像数据
"response_format": "url",
# 【watermark】(boolean, 可选) 是否在生成的图片中添加水印,默认值 true
# false:不添加水印
# true:在图片右下角添加"AI生成"字样的水印标识
"watermark": False,
# 【optimize_prompt_options】(object, 可选) 提示词优化功能的配置
"optimize_prompt_options": {
# 【optimize_prompt_options.mode】(string, 可选) 设置提示词优化功能使用的模式,默认值 standard
# standard:标准模式,生成内容的质量更高,耗时较长
# fast:快速模式,生成内容的耗时更短,质量一般;当前 doubao-seedream-5.0-lite 不支持
"mode": "standard"
}
}
# ===============================================================
# 步骤4: 发送请求并输出结果
# ===============================================================
# 发送 POST 请求到 API 服务器(stream=True 开启流式传输)
response = requests.post(url, headers=headers, json=payload, stream=True)
print(response.status_code)
# 流式读取响应,只保留关键信息
current_event = None
for line in response.iter_lines():
if line:
line = line.decode('utf-8')
# 记录事件类型
if line.startswith('event: '):
current_event = line[7:]
continue
# 处理数据行
if line.startswith('data: '):
data_str = line[6:]
else:
data_str = line
# 只输出图片生成事件和完成事件
if current_event == 'response.output_text.delta':
print(f"event: {current_event}")
print(f"data: {data_str}")
elif current_event == 'response.completed':
try:
data = json.loads(data_str)
usage = data.get('response', {}).get('usage', {})
print(f"event: {current_event}")
print(f"data: {json.dumps({'status': 'completed', 'usage': usage}, ensure_ascii=False)}")
except:
print(data_str)
elif data_str == '[DONE]':
print('[DONE]')返回示例
json
{
"created_at": 1772439766,
"id": "resp_bd608d40-d985-4b81-90ae-",
"object": "response",
"output": [
{
"image_url": {
"url": "https://ark-acg-cn-beijing.tos-cn-beijing.volces.com/..."
},
"type": "image_url"
},
{
"image_url": {
"url": "https://ark-acg-cn-beijing.tos-cn-beijing.volces.com/..."
},
"type": "image_url"
},
{
"image_url": {
"url": "https://ark-acg-cn-beijing.tos-cn-beijing.volces.com/..."
},
"type": "image_url"
}
],
"status": "completed",
"usage": {
"input_tokens": 0,
"input_tokens_details": {
"cached_tokens": 0
},
"output_tokens": 6600,
"output_tokens_details": {
"reasoning_tokens": 0
},
"total_tokens": 6600
}
}text
200
event: response.output_text.delta
data: {"content_index":0,"delta":"","item_id":"msg_8a5206c5aeca4053ad173f952a3ea648","logprobs":[],"output_index":0,"sequence_number":4,"type":"response.output_text.delta"}
event: response.output_text.delta
data: {"content_index":0,"delta":"","item_id":"msg_8a5206c5aeca4053ad173f952a3ea648","logprobs":[],"output_index":0,"sequence_number":5,"type":"response.output_text.delta"}
event: response.output_text.delta
data: {"content_index":0,"delta":"","item_id":"msg_8a5206c5aeca4053ad173f952a3ea648","logprobs":[],"output_index":0,"sequence_number":6,"type":"response.output_text.delta"}
event: response.completed
data: {"status": "completed", "usage": {"total_tokens": 6600, "input_tokens": 0, "input_tokens_details": {"cached_tokens": 0}, "output_tokens": 6600, "output_tokens_details": {"reasoning_tokens": 0}}}© 2026 DMXAPI doubao-seedream-5.0-lite 多图融合
