开发工具/音视频/语音与音色/音色复刻
音色复刻
更新于: 2026-06-25 19:29:14
扣子编程提供了音色复刻功能,支持用户上传音频文件或直接录制声音,以复刻特定的音色。音色复刻功能帮助你创建个性化的音色资源,从而在智能体或应用中实现更加自然和逼真的语音交互体验。
注意
音色复刻功能是一种音频处理技术,能够捕捉并模仿特定人的声音特征,包括音调、音色、节奏和语调等,从而生成与原声高度相似的声音。音色复刻能够创建个性化的音色资源,使得在智能体或 AI 应用中实现更加自然和逼真的语音交互体验。通过音色复刻,开发者和用户可以上传预先录制的音频样本或使用内置录音工具来复刻特定人的音色,进而在不同的应用场景中使用这些定制化的语音,以满足个性化需求,增强用户体验,例如教育、娱乐或客户服务,提供更加亲切和真实的交互方式。
使用音色功能前,请了解以下限制:
企业版订阅套餐中默认赠送一个复刻音色,如需复刻更多音色,需要购买声音复刻-音色,具体请参见购买声音复刻-音色。
目前扣子编程支持通过 API 或控制台的方式复刻音色。
扣子编程提供复刻音色和查看音色列表的 OpenAPI。
复刻音色 API 用于上传音频文件复刻一个新的音色。调用此 API 时需要上传一个音频文件作为音色复刻的素材。扣子编程会自动复刻音频文件中的人声音色,并将音色保存在当前账号的音色列表中。复刻出的音色可以用于合成语音,或者在扣子编程实时通话中作为智能体的音色。
调用接口时,需要指定以下参数:
复刻音色 API 的请求示例如下:
curl --location --request POST 'https://api.coze.cn/v1/audio/voices/clone' \
--header 'Authorization: Bearer pat_OYDacMzM3WyOWV3Dtj2bHRMymzxP****' \
--header 'Content-Type: application/json' \
--form 'voice_name="jay"' \
--form 'preview_text="你好,欢迎来到AI世界,我是你的专属AI克隆声音,希望未来可以一起好好相处。"' \
--form 'audio_format="mp3"' \
--form 'file=@"/xx/xx/xx/jay.MP3"'
音色是扣子编程工作空间中的一种资源,在工作空间中创建音色资源,并复刻音色之后,可以在实时语音通话等各种场景下使用该音色。复刻音色时支持上传预先录制的音频文件,或者朗读系统提供的文案。
在资源库页面右上角,单击 +资源,并选择音色,根据页面提示创建一个音色。创建成功后单击上传音频或开始录制。详细操作步骤可参考音色。