助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈
低代码项目
快速开始
智能体
工作流
应用
发布
模型
多人协作
开发工具
推广与变现

语音合成插件

更新于: 2026-06-24 15:44:40

语音合成插件能够根据指定的音色和文本内容合成音频,广泛适用于聊天陪伴、有声书合成、智能客服语音、音视频配音等场景。用户可以根据不同场景需求选择合适的音色,使生成的语音更加符合特定的风格和情感表达。本文介绍语音合成插件的使用方法。

使用限制

  • 并发限制:扣子主账号内的所有子账号共享语音合成的并发限制,最大并发数为 10。
  • 输入长度限制:单次请求的输入文本长度不超过 1024 个字节,约 340 个汉字。

费用说明

使用语音合成插件时,将根据所选音色,产生语音合成费用,对应的价格请参考音视频费用。涉及的计费项如下:

  • 复刻音色文字转语音字数
  • 系统音色文字转语音字数
  • 小模型合成次数

如果购买了扩容并发服务,还将产生扩容费用,详情请参考资源扩容费用

输入参数

输入参数说明如下表所示。

参数名称

是否必填

说明

text

必选

要合成音频的文本内容。长度不超过 1024 个字节,约 340 个汉字。

voice_id

可选

扣子编程音色 ID,支持扣子编程系统预置的音色或资源库中复刻的音色。
你可以通过系统音色列表或调用查看音色列表 API,查看音色 ID。

emotion

可选

设置多情感音色的情感类型,仅当 voice_id 为多情感音色时才支持设置情感类型。不同音色支持的情感范围不同,可以通过系统音色列表查看各音色支持的情感。默认为空。枚举值如下:

  • happy:开心。
  • sad:悲伤。
  • angry:愤怒。
  • surprised:惊讶。
  • fear:恐惧。
  • hate:厌恶。
  • excited:兴奋。
  • coldness:冷漠。
  • neutral:中性。

emotion_scale

可选

情感值用于量化情感的强度。数值越高,情感表达越强烈,例如: “开心” 的情感值 5 比 1 更显兴奋。
取值范围:1.0~5.0,默认值:4.0。

speed_ratio

可选

语速,数值越大,语速越快。例如,2 表示 2 倍速,即语速是正常速度的两倍。
大模型音色的取值范围为 0.5~2,小模型音色的取值范围为 0.2~3,通常保留一位小数即可。
默认值为 1,表示 1 倍速。

language

可选

音色的语种,所有中文音色支持中英文混合场景。可参考系统音色列表查看各音色支持的语种。

speaker_id

可选

预留参数,即将下线,推荐使用 voice_id 参数设置音色。

输出参数

参数

说明

code

返回状态码,0 表示成功,非 0 表示失败。

data

合成音频的在线文件链接。

说明

生成的音频 URL 有效期为 3 天,请及时转存。

log_id

日志 ID,用于问题排查和调试。

msg

执行插件时的状态描述或错误提示信息。

示例

在工作流中添加语音合成插件中的 speech_synthesis 工具。输入待合成的文本内容,你可以通过输出参数中的语音文件链接,聆听合成后的语音。
Image

  • 语音合成插件 ID:7426655854067351562