开发工具/API 参考/智能音视频/ASR、TTS 与音色/复刻音色
复刻音色
更新于: 2026-06-25 19:29:14
复刻指定音频文件中人声的音色。
注意
和扣子智能体进行实时的智能语音通话时,你可以选择智能体使用的音色,支持使用扣子编程提供系统内置音色,或通过复刻音色 API 复刻出的自定义音色。
此 API 用于上传音频文件复刻一个新的音色。调用此 API 时需要上传一个音频文件作为音色复刻的素材。扣子编程会自动复刻音频文件中的人声音色,并将音色保存在当前账号的音色列表中。复刻出的音色可以用于合成语音,或者在扣子编程实时通话中作为智能体的音色。
说明
上传的音频文件素材应符合以下要求:
|
类别 |
说明 |
|---|---|
|
文件格式 |
wav、mp3、ogg、m4a、aac、pcm。其中 pcm 仅支持 24k 采样率,单通道。 |
|
文件大小 |
最大不超过 10MB。每次最多上传1个音频文件。 |
|
音频时长 |
建议 10s~30s。 |
|
语种 |
支持中文、英文、日语、西班牙语、印度尼西亚语葡萄牙语。 |
|
文件录制 |
|
|
请求方式 |
POST |
|---|---|
|
请求地址 |
|
|
权限 |
|
|
接口说明 |
复刻指定音频文件中人声的音色。 |
|
参数 |
取值 |
说明 |
|---|---|---|
|
Authorization |
Bearer $Access_Token |
用于验证客户端身份的访问令牌。你可以在扣子编程中生成访问令牌,详细信息,参考准备工作。 |
|
Content-Type |
application/json |
解释请求正文的方式。 |
|
参数 |
类型 |
是否必选 |
示例 |
说明 |
|---|---|---|---|---|
|
voice_name |
String |
必选 |
开朗大男孩 |
此音色的名称,长度限制为 128 字节。 |
|
text |
String |
可选 |
你好呀 |
音频文件对应的文案。需要和音频文件中人声朗读的内容大致一致,扣子编程服务会对比音频与该文本的差异,若差异过大会报错 1109 WERError。最大长度为 1024 字节。 |
|
language |
String |
可选 |
zh |
音频文件中的语种,支持以下语种:
|
|
voice_id |
String |
可选 |
734829333445931**** |
需要训练的音色 ID,扣子编程支持重新复刻音色,也就是训练音色,训练后的音色会覆盖原有的音色。 |
|
preview_text |
String |
可选 |
你好,我是你的专属AI克隆声音 |
预览音频的文案。如果成功复刻音色,扣子编程会根据此文案生成一段新音色的预览音频。 |
|
space_id |
String |
可选 |
736163827687053**** |
克隆音色保存的扣子编程工作空间 ID,默认保存在当前账号的个人空间中。 |
|
参数 |
类型 |
示例 |
说明 |
|---|---|---|---|
|
code |
Long |
0 |
状态码。 |
|
data |
Object of CloneVoiceData |
{ “voice_id”: “xxx” } |
新音色的详细信息。 |
|
msg |
String |
“” |
状态信息。API 调用失败时可通过此字段查看详细错误信息。 |
|
detail |
Object of ResponseDetail |
{“logid”:“20241210152726467C48D89D6DB2****”} |
包含请求的详细信息的对象,主要用于记录请求的日志 ID 以便于排查问题。 |
|
参数 |
类型 |
示例 |
说明 |
|---|---|---|---|
|
voice_id |
String |
734829333445931**** |
复刻后的音色 ID,后续语音生成或重新克隆音色时需要传入该音色 ID。请妥善保存该 ID。 |
|
参数 |
类型 |
示例 |
说明 |
|---|---|---|---|
|
logid |
String |
20241210152726467C48D89D6DB2**** |
本次请求的日志 ID。如果遇到异常报错场景,且反复重试仍然报错,可以根据此 logid 及错误码联系扣子团队获取帮助。详细说明可参考获取帮助和技术支持。 |
curl --location --request POST 'https://api.coze.cn/v1/audio/voices/clone' \
--header 'Authorization: Bearer pat_OYDacMzM3WyOWV3Dtj2bHRMymzxP****' \
--header 'Content-Type: application/json' \
--form 'voice_name="jay"' \
--form 'preview_text="你好,欢迎来到AI世界,我是你的专属AI克隆声音,希望未来可以一起好好相处。"' \
--form 'audio_format="mp3"' \
--form 'file=@"/xx/xx/xx/jay.MP3"'
{
"detail": {
"logid": "202410242028595CCF353CEC86A8*****"
},
"data": {
"voice_id": "xxx" // 复刻后音色ID,请保存好,后续语音生成或者重新克隆音色需要传入
},
"code": 0,
"msg": ""
}
如果成功调用扣子编程的 API,返回信息中 code 字段为 0。如果状态码为其他值,则表示接口调用失败。此时 msg 字段中包含详细错误信息,你可以参考错误码文档查看对应的解决方法。