Skip to content

qwen-image-2.0 多图融合 API 使用文档

Qwen-Image-2.0 是阿里云推出的多模态图像编辑大模型,多图融合功能支持同时输入 1-3 张图像,通过自然语言指令将多张图像的内容、风格或角色元素智能融合到一张输出图像中。支持公网 URL、OSS 临时链接和 Base64 三种图像传入方式,输出分辨率可在 512×512 至 2048×2048 范围内灵活设置,提供提示词智能改写、反向提示词、随机数种子、水印控制等多项精细化调控参数,单次请求最多可生成 6 张图像。

🌐 请求地址

https://www.dmxapi.cn/v1/responses

WARNING

请妥善保管您的 API Key!严禁将密钥泄露给他人、硬编码到代码中或提交到公开的代码仓库。如果怀疑密钥已泄露,请立即前往 DMXAPI 官网重新生成。

🤖 模型名称

  • qwen-image-2.0

💻 多图融合示例代码

python
import requests
import json

# ═══════════════════════════════════════════════════════════════
# 步骤1: 配置 API 连接信息
# ═══════════════════════════════════════════════════════════════

# DMXAPI 服务端点地址
url = "https://www.dmxapi.cn/v1/responses"

# DMXAPI 密钥 (请替换为您自己的密钥)
# 获取方式: 登录 DMXAPI 官网 -> 个人中心 -> API 密钥管理
api_key = "sk-********************************************"

# ═══════════════════════════════════════════════════════════════
# 步骤2: 配置请求头
# ═══════════════════════════════════════════════════════════════

headers = {
    "Content-Type": "application/json",      # 指定请求体为 JSON 格式
    "Authorization": f"{api_key}",           # token 认证方式
}

# ═══════════════════════════════════════════════════════════════
# 步骤3: 配置请求参数
# ═══════════════════════════════════════════════════════════════

payload = {
    # 【model】(string, 必填) 模型名称
    "model": "qwen-image-2.0",
    "input": {
        "messages": [
            {
                # 【role】(string, 必填) 消息发送者角色,必须设置为 user
                "role": "user",
                "content": [
                    # 【image】(string, 必填) 输入图像的 URL 或 Base64 编码数据
                    # 支持传入 1-3 张图像,多图输入时按数组顺序定义图像顺序
                    # 输出图像的比例以最后一张图像为准
                    # 图像格式:JPG、JPEG、PNG、BMP、TIFF、WEBP、GIF(GIF 仅处理第一帧)
                    # 建议分辨率:宽高均在 384-3072 像素之间,单张大小不超过 10MB
                    {
                        "image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260310/rdsgaa/image+%2815%29.png"
                    },
                    {
                        "image": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20260310/qokhtl/image+%2816%29.png"
                    },
                    # 【text】(string, 必填) 正向提示词,描述期望生成的图像内容、风格和构图
                    # 支持中英文,长度不超过 800 个字符(每个汉字、字母、数字或符号计为一个字符)
                    # content 数组中必须包含且仅包含一个 text 对象,否则将报错
                    {
                        "text": "使用图一的城市照片作为底图。请勿更改照片中的真实建筑、街道、车辆或人物。保持照片的真实性。三个图二中的卡通形象在建筑物周围,一个趴在建筑物上方,一个从建筑物的右边探出头来,一个坐在建筑物前的空地上。该形象应采用扁平化的图形风格绘制,轮廓清晰,类似于壁画或海报插图。"
                    }
                ]
            }
        ],
                    "parameters": {
                    # 【n】(integer, 可选) 输出图像的数量,默认值为 1
                    # qwen-image-2.0 系列可选输出 1-6 张图片
                    "n": 1,
                    # 【negative_prompt】(string, 可选) 反向提示词,描述不希望在画面中出现的内容
                    # 支持中英文,长度上限 500 个字符
                    # 示例值:"低分辨率、错误、最差质量、低质量、残缺"
                    "negative_prompt": " ",
                    # 【prompt_extend】(bool, 可选) 是否开启提示词智能改写,默认值为 true
                    # 开启后模型会优化正向提示词,对描述较简单的提示词效果提升明显
                    "prompt_extend": True,
                    # 【watermark】(bool, 可选) 是否在图像右下角添加 "Qwen-Image" 水印,默认值为 false
                    "watermark": False,
                    # 【size】(string, 可选) 输出图像的分辨率,格式为 宽*高,例如 "1024*1536"
                    # qwen-image-2.0 系列:图像总像素需在 512*512 至 2048*2048 之间
                    # 默认总像素数接近 1024*1024,宽高比与输入图(多图时以最后一张为准)相近
                    # 系统会将实际输出调整为最接近的 16 的倍数
                    # 常见比例推荐:1:1 → "1024*1024",2:3 → "1024*1536",16:9 → "1280*720"
                    "size": "2048*2048",
                    # 【seed】(integer, 可选) 随机数种子,取值范围 [0, 2147483647]
                    # 使用相同的 seed 可使生成内容保持相对稳定(不保证完全一致)
                    # 不提供时算法自动使用随机数种子
                    "seed": 30
                }     
    }

}

# ═══════════════════════════════════════════════════════════════
# 步骤4: 发送请求并输出结果
# ═══════════════════════════════════════════════════════════════

# 发送 POST 请求到 API 服务器
response = requests.post(url, headers=headers, json=payload)

# 格式化输出 JSON 响应
# - indent=2: 缩进 2 空格,便于阅读
# - ensure_ascii=False: 正确显示中文字符
print(json.dumps(response.json(), indent=2, ensure_ascii=False))

📄 返回示例

json
{
  "output": [
    {
      "type": "message",
      "content": [
        {
          "type": "image",
          "text": "https://dashscope-7c2c.oss-accelerate.aliyuncs.com/7d/b0/20260327/5abe4571/f399c436-911b-4534-a3de-0ef9e3f7307c.png?Expires=1775216727&OSSAccessKeyId=LTAI5tPxpiCM2hjmWrFXrym1&Signature=kS81CqJe%2B96i7L2%2FlU3uno1QIqw%3D"
        }
      ]
    }
  ],
  "request_id": "9d3646aa-a3b0-4887-bc57-3cfaba9c3de2",
  "usage": {
    "total_tokens": 2000,
    "input_tokens": 0,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens": 2000,
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  }
}

© 2026 DMXAPI qwen-image-2.0 多图融合

一个 Key 用全球大模型