注意

企业版（企业标准版、企业旗舰版）默认赠送一个复刻音色，如需调用复刻音色 OpenAPI 复刻更多音色，请联系超级管理员或管理员购买音色复刻扩容包，具体步骤请参见购买音色复刻扩容包。音色复刻涉及音色数量费用和音色模型存储数费用，详细的费用信息可参考音视频费用。
调用此 API 之前请确认账户中积分或余额充足，以免账号欠费导致服务中断。

什么是音色复刻

音色复刻功能是一种音频处理技术，能够捕捉并模仿特定人的声音特征，包括音调、音色、节奏和语调等，从而生成与原声高度相似的声音。音色复刻能够创建个性化的音色资源，使得在智能体或 AI 应用中实现更加自然和逼真的语音交互体验。通过音色复刻，开发者和用户可以上传预先录制的音频样本或使用内置录音工具来复刻特定人的音色，进而在不同的应用场景中使用这些定制化的语音，以满足个性化需求，增强用户体验，例如教育、娱乐或客户服务，提供更加亲切和真实的交互方式。

使用限制

使用音色功能前，请了解以下限制：

仅扣子企业版（企业标准版、企业旗舰版）支持使用音色复刻功能。
在工作空间中复刻的音色资源仅限于该工作空间的成员使用。即使在同一个企业中，不同工作空间复刻的音色资源是独立的，不允许跨空间使用。

购买音色复刻扩容包

企业版订阅套餐中默认赠送一个复刻音色，如需复刻更多音色，需要购买声音复刻-音色，具体请参见购买声音复刻-音色。

复刻方式

目前扣子编程支持通过 API 或控制台的方式复刻音色。

通过 API 复刻音色

扣子编程提供复刻音色和查看音色列表的 OpenAPI。
复刻音色 API 用于上传音频文件复刻一个新的音色。调用此 API 时需要上传一个音频文件作为音色复刻的素材。扣子编程会自动复刻音频文件中的人声音色，并将音色保存在当前账号的音色列表中。复刻出的音色可以用于合成语音，或者在扣子编程实时通话中作为智能体的音色。
调用接口时，需要指定以下参数：

voice_name：指定音色名称。长度限制为 128 字节。
audio_format：上传的音频文件编码格式，支持设置为 wav、mp3、ogg、m4a、aac 或 pcm 格式。其中 pcm 仅支持 24k 采样率、单通道。
file：使用 multipart/form-data 方式上传文件。

复刻音色 API 的请求示例如下：

curl --location --request POST 'https://api.coze.cn/v1/audio/voices/clone' \
--header 'Authorization: Bearer pat_OYDacMzM3WyOWV3Dtj2bHRMymzxP****' \
--header 'Content-Type: application/json' \
--form 'voice_name="jay"' \
--form 'preview_text="你好，欢迎来到AI世界，我是你的专属AI克隆声音，希望未来可以一起好好相处。"' \
--form 'audio_format="mp3"' \
--form 'file=@"/xx/xx/xx/jay.MP3"'

通过控制台复刻音色

音色是扣子编程工作空间中的一种资源，在工作空间中创建音色资源，并复刻音色之后，可以在实时语音通话等各种场景下使用该音色。复刻音色时支持上传预先录制的音频文件，或者朗读系统提供的文案。
在资源库页面右上角，单击 +资源，并选择音色，根据页面提示创建一个音色。创建成功后单击上传音频或开始录制。详细操作步骤可参考音色。

系统音色列表