资源/音色
音色
更新于: 2026-06-24 15:44:40
扣子编程提供了音色复刻功能,支持用户上传音频文件或直接录制声音,以复刻特定的音色。音色复刻功能帮助你创建个性化的音色资源,从而在低代码智能体或应用中实现更加自然和逼真的语音交互体验。
音色复刻功能是一种音频处理技术,能够捕捉并模仿特定人的声音特征,包括音调、音色、节奏和语调等,从而生成与原声高度相似的声音。音色复刻能够创建个性化的音色资源,使得在智能体或 AI 应用中实现更加自然和逼真的语音交互体验。通过音色复刻,开发者和用户可以上传预先录制的音频样本或使用内置录音工具来复刻特定人的音色,进而在不同的应用场景中使用这些定制化的语音,以满足个性化需求,增强用户体验,例如教育、娱乐或客户服务,提供更加亲切和真实的交互方式。
音色复刻功能在多种场景都有广泛的应用。
使用音色功能前,请了解以下限制:
|
限制 |
说明 |
|---|---|
|
付费套餐 |
企业版(标准版、旗舰版)用户可使用音色复刻功能。 |
|
免费额度 |
系统默认赠送一个音色,企业成员可以直接创建并使用该音色。企业内可创建的音色数量取决于购买的音色数量,如需创建更多音色,需要先购买音色扩容包,购买方式可参考购买声音复刻-音色。 |
|
音色权限 |
在工作空间中复刻的音色,除创建者本人外,仅限该工作空间的成员使用。不同企业复刻的音色资源是独立的,不允许跨企业使用。 |
|
训练次数 |
包括首次复刻在内,每个自定义音色最多被训练 10 次,训练后的音色会覆盖原音色。 |
|
使用权限 |
为智能体配置复刻音色并发布之后,在商店等所有发布渠道内,仅复刻音色的所有者可以使用该音色。 |
|
发布渠道 |
豆包渠道不支持使用扣子编程的复刻音色,音色将无法生效。 |
声音复刻功能的计费项包括音色数量和音色存储数。详细费用说明,可参考语音合成阶梯价。
针对企业版(标准版、旗舰版)用户,扣子编程支持上传音频文件或直接录制声音,以复刻特定的音色。通过音色复刻功能,可以创建专属的音色资源,进而在智能体或应用中提供更加自然和逼真的语音交互体验。
企业超级管理员可以根据需求购买音色扩容包,企业成员可创建的音色数量取决于所购买的声音复刻-音色。购买声音复刻-音色的详细步骤请参见购买声音复刻-音色。
说明
主账号或具备火山引擎扣子编程服务购买权限(如 CozeFullAccess 权限)的 IAM 用户,均可购买音色包。
企业成员可以在目标工作空间的资源库中创建音色,并直接上传预先录制好的音频文件或使用平台内置的录音工具录制音频,上传或录制后就可以对音频进行复刻。
创建音色完成后,音色可以作为资源保存在资源库中,供智能体或应用使用。
调用复刻音色OpenAPI 创建并复刻音色,详细说明可参考音色复刻。
创建完音色资源后,即可为智能体设置音色。你可以直接为智能体指定一个固定音色,也可以在智能音视频通话中灵活选择智能体音色。
https://www.coze.cn/space/7491179807783911458/voice/749200079046752**** 中,749200079046752**** 即为音色 ID。创建自定义音色后,你可以在资源库或通过 OpenAPI 查看音色资源。
speech_synthesis插件,你可以将自定义的文本内容根据指定的语种、语速和音色进行音频合成,从而生成符合需求的语音文件。通过音色定制,可以为合成的音频赋予独特的语音风格,使其更加贴近真实人声,提升语音的自然度和亲和力,广泛应用于有声读物、语音播统、虚拟助手等领域,满足多样化的语音合成需求。复刻音色后,每个月需要支付音色模型存储费用,如果音色训练次数已达上限,不再需要使用某个音色,可以删除音色以节省存储费用。
说明
进入工作空间的资源库,单击顶部的音色页签,在目标音色右侧操作列单击更多图标,选择删除。
个人版用户不支持创建音色,只能使用系统音色。仅企业超级管理员可以购买音色扩容包,企业成员可以创建并使用音色。
一个企业账号可以创建的音色数量取决于所购买的音色扩容包。企业超级管理员可以根据需求购买音色扩容包,企业成员可依据扩容包中的数量创建音色。
目前,音色支持中文、英文、日语、西班牙语、印尼语、葡萄牙语。
音色资源支持边说边转,可以用于实时对话场景。