开发工具/音视频/基于 RTC 实现音视频通话/接入流程
接入流程
更新于: 2026-06-25 19:29:14
扣子编程 Realtime SDK 是基于火山引擎 RTC 封装的音视频 SDK,主要用于实现用户与 AI 智能体之间的音视频通话功能。本文介绍 Realtime SDK 的接入流程,帮助开发者快速搭建并实现 AI 智能体与用户之间的实时音视频互动。
你可以基于Realtime SDK 和火山引擎 RTC SDK 实现 AI 智能体与用户之间的实时音视频互动:
通过 Realtime SDK 实现音视频通话的流程如下图所示。
voice_id 参数指定智能体使用的音色,扣子编程提供一系列系统音色,如果没有合适的系统音色,你也可以调用复刻音色API,复刻指定音频文件中的人声音色。此外,你还可以设置房间内的音频编码格式,提高音频通话质量。curl --location --request POST 'https://api.coze.cn/v1/audio/rooms' \
--header 'Authorization: Bearer pat_OYDacMzM3WyOWV3Dtj2bHRMymzxP****' \
--header 'Content-Type: application/json' \
--data-raw '{
"bot_id": "734829333445931****"
}'
{
"detail": {
"logid": "202410291302044CD1CC3B4AE0897***"
},
"data": {
"room_id": "room_id_7431057983427067913", // 房间 id
"app_id": "6705332c79516e01****", // app_id
"token": "0016705*****NzkxMxcANTE1MjkFAAAAAAAAAAEAAAAAAAIAAAAAAAMAAAAAAAQAAAAAACAA58QEAvxdy3LHNzSwq6apM9PUKM2rOsxIg/VB4b1xEFA=",
"uid": "uid_7431057983427051529"
},
"code": 0,
"msg": ""
}
说明
扣子编程提供了丰富的客户端 SDK,支持多种平台和语言。请根据项目需求,选择对应的 SDK。
| 平台 | 参考文档 |
|---|---|
| Web | 集成音视频 Realtime Web SDK |
| 嵌入式 | 集成音视频 Realtime 嵌入式 SDK |
| iOS | 集成音视频 Realtime iOS SDK |
| Android | 集成音视频 Realtime Android SDK |