Skip to content

doubao-embedding-vision-251215 多模态向量化API文档

Doubao-embedding-vision 是由字节跳动研发的多模态向量化模型。它能将文本、图片以及视频等混合输入内容转换为统一的向量表示,从而帮助您更高效地处理跨模态数据,实现精准的文搜图、图搜图和图文混合搜索。

接口地址

https://www.dmxapi.cn/v1/responses

模型名称

doubao-embedding-vision-251215

示例代码

python
"""
╔═══════════════════════════════════════════════════════════════╗
║                  DMXAPI 自研接口                               ║
╚═══════════════════════════════════════════════════════════════╝

📝 功能说明:
   本脚本演示如何使用 requests 库调用 DMXAPI 的自研接口

═══════════════════════════════════════════════════════════════
"""

import requests
import json

# ═══════════════════════════════════════════════════════════════
# 🔑 步骤1: 配置 API 连接信息
# ═══════════════════════════════════════════════════════════════

# 🌐 DMXAPI 服务端点地址
url = "https://www.dmxapi.cn/v1/responses"

# 🔐 DMXAPI 密钥 (请替换为您自己的密钥)
# 获取方式: 登录 DMXAPI 官网 -> 个人中心 -> API 密钥管理
api_key = "sk-*****************************************"   #填写您的api_key

# ═══════════════════════════════════════════════════════════════
# 📋 步骤2: 配置请求头
# ═══════════════════════════════════════════════════════════════

headers = {
    "Content-Type": "application/json",      # 指定请求体为 JSON 格式
    "Authorization": f"{api_key}",    # token 认证方式
}

# ═══════════════════════════════════════════════════════════════
# 💬 步骤3: 配置请求参数
# ═══════════════════════════════════════════════════════════════

# 📌 input 数组说明:
#   - 支持多模态输入:视频(video_url)、图片(image_url)、文本(text)
#   - 视频格式:.mp4、.avi、.mov(小写),单个文件≤50MB
#   - 图片URL:需可访问,或使用 Base64 编码(格式:data:image/{格式};base64,{编码})
#   - 文本:UTF-8 编码,长度不超过模型最大输入 token 数

# 📌 embedding 配置说明:
#   - encoding_format: 返回格式,支持 "float"
#   - dimensions: 向量维度,取值 1024 或 2048
#   - instructions: 推理提示词,未传入时按输入模态生成默认值
#   - sparse_embedding: 稀疏向量开关
#       - "disabled": 仅输出稠密向量
#       - "enabled": 同时输出稠密向量和稀疏向量(仅纯文本输入支持)

payload = {
    "model": "doubao-embedding-vision-251215",
    "input": [
        {
            "type": "video_url",
            "video_url": {
                "url": "https://ark-project.tos-cn-beijing.volces.com/doc_video/ark_vlm_video_input.mp4"
            }
        },
        {
            "type": "image_url",
            "image_url": {
                "url": "https://ark-project.tos-cn-beijing.volces.com/doc_image/tower.png"
            }
        },
        {
            "type": "text",
            "text": "视频和图片里有什么"
        }
    ],
    "encoding_format": "float",
    "dimensions": 1024,
    "instructions": "",
    "sparse_embedding": {
        "type": "disabled"
    }
}

# ═══════════════════════════════════════════════════════════════
# 📤 步骤4: 发送请求并输出结果
# ═══════════════════════════════════════════════════════════════

# 发送 POST 请求到 API 服务器
response = requests.post(url, headers=headers, json=payload)

# 格式化输出 JSON 响应
# - indent=2: 缩进 2 空格,便于阅读
# - ensure_ascii=False: 正确显示中文字符
print(json.dumps(response.json(), indent=2, ensure_ascii=False))

返回示例

python
{
  "created": 1770037698,
  "data": [
    {
      "embedding": [
        0.01556396484375,
        0.06884765625,
        
        ............., 

        0.0230712890625,
        0.0244140625
      ],
      "index": 0,
      "object": "embedding"
    }
  ],
  "id": "0217700376972756a0b6f9037ae98ed8c3a7859aa85dfeefc45ea",
  "model": "doubao-embedding-vision-251215",
  "object": "list",
  "usage": {
    "total_tokens": 27837,
    "input_tokens": 27837,
    "input_tokens_details": {
      "cached_tokens": 0
    },
    "output_tokens": 0,
    "output_tokens_details": {
      "reasoning_tokens": 0
    }
  }
}

© 2026 DMXAPI doubao-embedding-vision-251215

一个 Key 用全球大模型