音乐搜索和播放插件支持根据输入的提示词搜索并播放字节易颂曲库中的歌曲。插件后台集成了字节易颂曲库中的几万首歌曲,涵盖了各种风格和类型的歌曲,包括抖音热门歌曲等。用户可以在语音通话过程中,通过语音指令,使低代码智能体搜索并播放歌曲,为用户提供全新的音乐体验。
以下展示了 WebSocket 实时语音 Demo,在语音通话过程中通过语音指令使智能体播放歌曲的效果。
音乐搜索和播放插件根据插件调用次数计费,对应的计费项及单价请参考插件费用。
在调用 music_agent 工具时,你需要输入提示词,播放指定风格的歌曲。
输入参数说明如下表所示:
|
参数 |
是否必选 |
说明 |
|---|---|---|
|
content |
必选 |
输入提示词内容,用于指定播放的歌曲风格或具体歌曲名称,例如:播放一首适合作为背景音的轻音乐。 |
|
session_id |
可选 |
该参数用于关联对话上下文,帮助插件在多轮对话中更好的理解用户意图。如果未传入 |
|
参数 |
说明 |
|---|---|
|
code |
执行插件时的状态码。 |
|
log_id |
日志 ID。 |
|
msg |
执行插件时的状态描述或错误提示信息。 |
|
data.songs.song_id |
歌曲 ID。 |
|
data.songs.play_url |
歌曲的 URL 链接,链接有效期为 1 小时。 |
|
data.songs.play_vid |
歌曲的视频 ID。 |
本文以搭建一个支持音乐播放与语音聊天的对话流模式智能体为例,通过意图识别精准判断用户需求,从而决定是播放音乐还是进入闲聊模式。
搭建一个既支持播放音乐又支持闲聊的对话流,对话流的整体设计类似如下:
配置节点如下:
|
节点 |
说明 |
示例 |
|---|---|---|
|
开始节点 |
如果需要插件更好的理解上下文,你可以在开始节点添加 |
|
|
意图识别节点 |
智能体对用户输入的语音指令进行意图识别,判断用户是否需要播放音乐。如果是,则调用音乐搜索和播放插件。如果不是,则进入闲聊节点。 |
|
|
音乐搜索和播放插件 |
添加音乐搜索和播放插件中的
|
|
|
延时安抚(输出节点) |
由于音乐搜索链路耗时较长,可以在插件节点前,增加输出节点,流式输出安抚的内容,提升用户等待体验。 说明 安抚内容的结尾需要加标点符号,因为扣子编程语音合成需要识别到断句后才会将文本转换为语音。 |
|
|
文本输出(输出节点) |
在插件节点后,你还可以增加输出节点,引导用户进行下一轮对话。 |
|
|
闲聊(大模型节点) |
根据实际需求设计闲聊节点的提示词,包括回复逻辑和风格等。 |
|
|
结束节点 |
结束节点不需要设置输出变量,智能体直接获取插件或闲聊节点的输出。 |
|
测试并发布智能体。
体验效果。
在体验智能音视频 Demo页面,通过语音指令验证智能体播放音乐的实际效果。
如果曲库中没有对应版权的歌曲,智能体会提示未找到对应版权的歌曲,请换一首。
此外,当插件未返回歌曲时,本次插件调用不会收取费用。
- 音乐搜索和播放插件 ID:7524979194451935283