doubao-embedding-vision-251215 多模态向量化API文档
Doubao-embedding-vision 是由字节跳动研发的多模态向量化模型。它能将文本、图片以及视频等混合输入内容转换为统一的向量表示,从而帮助您更高效地处理跨模态数据,实现精准的文搜图、图搜图和图文混合搜索。
接口地址
https://www.dmxapi.cn/v1/responses模型名称
doubao-embedding-vision-251215
示例代码
python
"""
╔═══════════════════════════════════════════════════════════════╗
║ DMXAPI 自研接口 ║
╚═══════════════════════════════════════════════════════════════╝
📝 功能说明:
本脚本演示如何使用 requests 库调用 DMXAPI 的自研接口
═══════════════════════════════════════════════════════════════
"""
import requests
import json
# ═══════════════════════════════════════════════════════════════
# 🔑 步骤1: 配置 API 连接信息
# ═══════════════════════════════════════════════════════════════
# 🌐 DMXAPI 服务端点地址
url = "https://www.dmxapi.cn/v1/responses"
# 🔐 DMXAPI 密钥 (请替换为您自己的密钥)
# 获取方式: 登录 DMXAPI 官网 -> 个人中心 -> API 密钥管理
api_key = "sk-*****************************************" #填写您的api_key
# ═══════════════════════════════════════════════════════════════
# 📋 步骤2: 配置请求头
# ═══════════════════════════════════════════════════════════════
headers = {
"Content-Type": "application/json", # 指定请求体为 JSON 格式
"Authorization": f"{api_key}", # token 认证方式
}
# ═══════════════════════════════════════════════════════════════
# 💬 步骤3: 配置请求参数
# ═══════════════════════════════════════════════════════════════
# 📌 input 数组说明:
# - 支持多模态输入:视频(video_url)、图片(image_url)、文本(text)
# - 视频格式:.mp4、.avi、.mov(小写),单个文件≤50MB
# - 图片URL:需可访问,或使用 Base64 编码(格式:data:image/{格式};base64,{编码})
# - 文本:UTF-8 编码,长度不超过模型最大输入 token 数
# 📌 embedding 配置说明:
# - encoding_format: 返回格式,支持 "float"
# - dimensions: 向量维度,取值 1024 或 2048
# - instructions: 推理提示词,未传入时按输入模态生成默认值
# - sparse_embedding: 稀疏向量开关
# - "disabled": 仅输出稠密向量
# - "enabled": 同时输出稠密向量和稀疏向量(仅纯文本输入支持)
payload = {
"model": "doubao-embedding-vision-251215",
"input": [
{
"type": "video_url",
"video_url": {
"url": "https://ark-project.tos-cn-beijing.volces.com/doc_video/ark_vlm_video_input.mp4"
}
},
{
"type": "image_url",
"image_url": {
"url": "https://ark-project.tos-cn-beijing.volces.com/doc_image/tower.png"
}
},
{
"type": "text",
"text": "视频和图片里有什么"
}
],
"encoding_format": "float",
"dimensions": 1024,
"instructions": "",
"sparse_embedding": {
"type": "disabled"
}
}
# ═══════════════════════════════════════════════════════════════
# 📤 步骤4: 发送请求并输出结果
# ═══════════════════════════════════════════════════════════════
# 发送 POST 请求到 API 服务器
response = requests.post(url, headers=headers, json=payload)
# 格式化输出 JSON 响应
# - indent=2: 缩进 2 空格,便于阅读
# - ensure_ascii=False: 正确显示中文字符
print(json.dumps(response.json(), indent=2, ensure_ascii=False))返回示例
python
{
"created": 1770037698,
"data": [
{
"embedding": [
0.01556396484375,
0.06884765625,
.............,
0.0230712890625,
0.0244140625
],
"index": 0,
"object": "embedding"
}
],
"id": "0217700376972756a0b6f9037ae98ed8c3a7859aa85dfeefc45ea",
"model": "doubao-embedding-vision-251215",
"object": "list",
"usage": {
"total_tokens": 27837,
"input_tokens": 27837,
"input_tokens_details": {
"cached_tokens": 0
},
"output_tokens": 0,
"output_tokens_details": {
"reasoning_tokens": 0
}
}
}© 2026 DMXAPI doubao-embedding-vision-251215
