扣子扣子编程扣子罗盘资源

文档反馈

低代码项目

快速开始

智能体

工作流

应用

资源

插件

创建插件

通过固定 IP 访问插件

端插件

MCP 服务

图像官方收费插件

音视频官方收费插件

视频剪辑工具插件

视频生成插件

音乐搜索和播放插件

Doubao-音乐生成插件

音乐生成插件

语音合成插件

语音识别插件

语音播客插件

工具类官方收费插件

管理插件版本

管理企业插件

插件常见问题

提示词

知识库

数据库

发布

模型

多人协作

开发工具

推广与变现

语音合成插件

更新于: 2026-06-24 15:44:40

语音合成插件能够根据指定的音色和文本内容合成音频，广泛适用于聊天陪伴、有声书合成、智能客服语音、音视频配音等场景。用户可以根据不同场景需求选择合适的音色，使生成的语音更加符合特定的风格和情感表达。本文介绍语音合成插件的使用方法。

使用限制

并发限制：扣子主账号内的所有子账号共享语音合成的并发限制，最大并发数为 10。
输入长度限制：单次请求的输入文本长度不超过 1024 个字节，约 340 个汉字。

费用说明

使用语音合成插件时，将根据所选音色，产生语音合成费用，对应的价格请参考音视频费用。涉及的计费项如下：

复刻音色文字转语音字数
系统音色文字转语音字数
小模型合成次数

如果购买了扩容并发服务，还将产生扩容费用，详情请参考资源扩容费用。

输入参数

输入参数说明如下表所示。

参数名称	是否必填	说明
text	必选	要合成音频的文本内容。长度不超过 1024 个字节，约 340 个汉字。
voice_id	可选	扣子编程音色 ID，支持扣子编程系统预置的音色或资源库中复刻的音色。你可以通过系统音色列表或调用查看音色列表 API，查看音色 ID。
emotion	可选	设置多情感音色的情感类型，仅当 `voice_id` 为多情感音色时才支持设置情感类型。不同音色支持的情感范围不同，可以通过系统音色列表查看各音色支持的情感。默认为空。枚举值如下： `happy`：开心。 `sad`：悲伤。 `angry`：愤怒。 `surprised`：惊讶。 `fear`：恐惧。 `hate`：厌恶。 `excited`：兴奋。 `coldness`：冷漠。 `neutral`：中性。
emotion_scale	可选	情感值用于量化情感的强度。数值越高，情感表达越强烈，例如： “开心” 的情感值 5 比 1 更显兴奋。取值范围：1.0~5.0，默认值：4.0。
speed_ratio	可选	语速，数值越大，语速越快。例如，2 表示 2 倍速，即语速是正常速度的两倍。大模型音色的取值范围为 0.5~2，小模型音色的取值范围为 0.2~3，通常保留一位小数即可。默认值为 1，表示 1 倍速。
language	可选	音色的语种，所有中文音色支持中英文混合场景。可参考系统音色列表查看各音色支持的语种。
speaker_id	可选	预留参数，即将下线，推荐使用 `voice_id` 参数设置音色。

输出参数

参数	说明
code	返回状态码，`0` 表示成功，非 `0` 表示失败。
data	合成音频的在线文件链接。说明生成的音频 URL 有效期为 3 天，请及时转存。
log_id	日志 ID，用于问题排查和调试。
msg	执行插件时的状态描述或错误提示信息。

示例

在工作流中添加语音合成插件中的 speech_synthesis 工具。输入待合成的文本内容，你可以通过输出参数中的语音文件链接，聆听合成后的语音。

语音合成插件 ID：7426655854067351562

音乐生成插件

语音识别插件