1. 语音合成
星光API
  • 所有对话模型均兼容 OpenAI 格式
  • 聊天对话
    • ChatGPT(Chat)
      • 创建聊天函数调用
      • 创建视频, 带图片
      • 连续修改生成视频
      • 创建结构化输出
      • 控制推理模型努力程度
    • ChatGPT(Responses)
      • 创建模型响应
      • 创建函数调用
      • 创建模型响应(流式返回)
      • 创建模型响应 (控制思考长度)
      • 创建网络搜索
      • 创建模型响应 gpt-5启用思考
    • Gemini官方格式
      • 创建视频
      • GemIni原生接口格式
      • 图片生成
      • 文档理解
      • 视频理解
      • 音频理解
      • TTS 文本转语音
    • Claude官方格式
      • Chat兼容格式
      • 联网搜索
      • 创建格式化输出
      • 创建函数调用 (流式)
      • 创建思考聊天
      • PDF支持
      • PDF支持 base64格式
      • 创建聊天补全 (流式)
  • 绘画模型
    • 通用生图(推荐)
      • Generations通用文生图
      • Edits通用图像编辑&图生图
    • Gemini绘图
      • Generations
      • Gemini原生格式
      • 文生图text-to-image
      • 图生图image-to-image
    • 即梦绘画
      • 通用聊天格式
      • Gemini格式
    • GPT-Image
      • gpt-image-2 创建图像
      • gpt-image-2 图像编辑
    • Midjourney
      • 上传图片
      • 提交Imagine任务
      • 根据任务ID 查询任务状态
      • 根据ID列表查询任务
      • 获取任务图片的seed
      • 执行Action动作
      • 提交Blend任务
      • 提交Describe任务
      • 提交Modal
    • Flux绘图
      • 文生图
      • 图生图
  • 视频模型
    • 统一接口
      • 创建视频
      • 查询结果
    • Grok视频
      • 创建视频任务
      • 查询任务状态
    • 即梦Seedance2.0
      • 标准接口
        • 文生视频
        • 单图生视频
        • 首尾帧生视频
        • 多图参考模式
        • 全能参考模式
        • 视频编辑
        • 视频延长
        • 查询结果
        • 创建虚拟资源库
        • 查询素材结果
      • SD2特价
        • 创建视频任务
        • 查询结果
    • Veo视频
      • 计费说明
      • 使用说明和示例
      • 状态码说明和注意事项
      • 文生视频
      • 图生视频
      • 查询任务状态
      • 查询任务状态和结果地址
      • 下载视频
    • RunWay视频
      • [推荐]统一任务格式
        • 文生视频
        • 图生视频
        • 视频生视频
        • 查询任务结果
      • 官方格式
        • 图生视频
        • 视频生视频
        • 查询任务结果
    • 快手可灵
      • 使用说明,必看!!
      • 文生视频
      • 单图生视频
      • 多图生视频
      • 首尾帧
      • 动作控制(Kling-2.6 专用)
      • 数字人
      • 对口型
      • 参考视频高级透传(file_infos)
      • 动作控制 + file_infos
      • ExtInfo 多镜头(Kling-3.0 高级)
      • 查询结果
  • 音频模型
    • Suno音乐
      • 生成音乐
      • 生成歌词
      • 查询单个任务[歌曲]
      • 查询单个任务[歌词]
      • 批量查询任务
    • MiniMax音频
      • 音乐生成
        • 音乐生成
        • 歌词生成
      • 语音合成
        • 语音接口说明
        • 音频复刻注意事项
        • 同步语音合成
          POST
        • 上传复刻音频
          POST
        • 音色快速复刻
          POST
        • 查询可用音色
          POST
    • 谷歌Lyria3
      • Google原生格式
  • 热门应用对接
    • Claude Code 安装使用教程
    • CodeX安装配置教程(Linux)
  • 平台API
    • 文件上传
  1. 语音合成

语音接口说明

MiniMax 语音合成接口说明#

文本转语音(TTS)接口,请求格式兼容 OpenAI Audio Speech,扩展参数通过 metadata 传递。

接口#

说明方法路径
创建语音POST{站点根}/v1/audio/speech
请求头:
Header值
AuthorizationBearer <API 令牌>
Content-Typeapplication/json

请求参数#

顶层字段#

参数类型必填说明
modelstring是模型名称,如 speech-2.8-hd、speech-2.8-turbo、speech-02-hd、speech-2.6-hd
inputstring是待合成文本,支持在文本中嵌入语气词标签,如 (laughs)
voicestring是音色 ID,如 male-qn-qingse、female-tianmei、English_Graceful_Lady
speednumber否语速,默认由模型决定
response_formatstring否输出音频格式,如 mp3、wav、flac
metadataobject否MiniMax 扩展参数,见下表

metadata 字段#

参数类型说明
voice_settingobject音色详细设置
audio_settingobject输出音频参数
pronunciation_dictobject自定义发音
timbre_weightsarray多音色混合
voice_modifyobject声音效果器
language_booststring语言增强
subtitle_enableboolean是否返回字幕
aigc_watermarkboolean是否添加 AIGC 水印
output_formatstring输出格式,与 response_format 作用类似

metadata.voice_setting#

参数类型说明
voice_idstring音色 ID,若填写则覆盖顶层 voice
speednumber语速
volnumber音量
pitchnumber音调
emotionstring情感,如 happy
text_normalizationboolean文本规范化
latex_readbooleanLaTeX 朗读

metadata.audio_setting#

参数类型说明
sample_rateinteger采样率,如 32000
bitrateinteger比特率,如 128000
formatstring格式,如 mp3
channelinteger声道数
force_cbrboolean强制 CBR 编码

metadata.pronunciation_dict#

参数类型说明
tonestring[]发音规则列表,如 ["处理/(chu3)(li3)", "危险/dangerous"]

metadata.timbre_weights[]#

参数类型说明
voice_idstring参与混合的音色 ID
weightinteger权重

metadata.voice_modify#

参数类型说明
pitchinteger音调偏移
intensityinteger强度
timbreinteger音色
sound_effectsstring音效类型,如 robotic

备注#

使用 metadata.voice_setting 时,请在其中完整填写 voice_id;若只传部分字段(如仅 emotion),会覆盖顶层 voice 的映射结果。
模型若配置了按字符计费,voice 须为官方系统音色,或当前用户已通过音色复刻成功登记的复刻音色。
成功响应为二进制音频(通常为 MP3),请保存为文件后播放,勿按 JSON 或纯文本解析。

响应#

HTTP 状态说明
200成功,响应体为音频二进制数据
4xx / 5xx失败,响应体为 JSON 错误信息
失败响应示例:
{
  "error": {
    "message": "错误描述",
    "type": "new_api_error",
    "code": "invalid_request"
  }
}

示例#

1. 基础合成#

2. 语气词与情感#

{
  "model": "speech-2.8-hd",
  "input": "今天是不是很开心呀(laughs),当然了!",
  "voice": "male-qn-qingse",
  "response_format": "mp3",
  "metadata": {
    "voice_setting": {
      "voice_id": "male-qn-qingse",
      "speed": 1,
      "vol": 1,
      "pitch": 0,
      "emotion": "happy"
    },
    "audio_setting": {
      "sample_rate": 32000,
      "bitrate": 128000,
      "format": "mp3",
      "channel": 1
    },
    "subtitle_enable": false
  }
}

3. 发音词典#

{
  "model": "speech-2.8-hd",
  "input": "请正确处理这个危险词汇。",
  "voice": "female-tianmei",
  "response_format": "mp3",
  "metadata": {
    "pronunciation_dict": {
      "tone": ["处理/(chu3)(li3)", "危险/dangerous"]
    }
  }
}

4. 多音色混合#

{
  "model": "speech-2.6-hd",
  "input": "这是使用混合音色的语音合成示例。",
  "voice": "female-tianmei",
  "response_format": "mp3",
  "metadata": {
    "timbre_weights": [
      { "voice_id": "female-chengshu", "weight": 30 },
      { "voice_id": "female-tianmei", "weight": 70 }
    ]
  }
}

5. 声音效果器#

{
  "model": "speech-2.6-hd",
  "input": "这是带声音效果器的语音合成。",
  "voice": "English_Graceful_Lady",
  "response_format": "mp3",
  "metadata": {
    "voice_modify": {
      "pitch": 20,
      "intensity": -30,
      "timbre": 10,
      "sound_effects": "robotic"
    }
  }
}

6. 复刻音色#

{
  "model": "speech-02-hd",
  "input": "你好,这是复刻音色的语音合成。",
  "voice": "moss_audio_ce44fc67-7ce3-xxxx",
  "response_format": "mp3"
}
修改于 2026-05-30 13:33:42
上一页
歌词生成
下一页
音频复刻注意事项
Built with