资源/插件/音视频官方收费插件/语音播客插件
语音播客插件
更新于: 2026-06-24 15:44:40
语音播客插件支持根据文本生成双人对话形式的播客音频,广泛应用于播客创作。本文介绍语音播客插件的使用方法。
用户可以输入一篇现成的文章,或者仅输入一个主题,语音播客插件即可自动生成播客内容和音频。该插件不仅能够智能理解文本内容,还能生成流畅自然的播客音频,支持双人对谈、交叉附和,听觉效果高度拟人化。相比传统的真人播客,该插件具备成本低、速度快、时效性高、个性化等显著优势,为音频内容生产带来高效智能的新体验。
语音播客插件基于火山引擎语音播客 API 开发,包含两个工具: genPodcastURL 和 genPodcastStream。
播客试听:
播客音频示例.mp3
语音播客插件将根据豆包语音播客大模型消耗的 Token 数计费。对应的计费项及单价说明,请参考模型费用。
说明
以生成一段时长为 30 分钟、语速 150 字/分钟的播客为例,播客插件费用包括输入和输出两部分,具体如下:
因此本示例中生成 30 分钟的播客,费用约为 5.31 元。
基于输入的文本,生成播客内容和音频链接。你可以通过此链接访问生成的播客音频。
输入参数说明如下表所示。
|
参数名称 |
是否必填 |
说明 |
|---|---|---|
|
input_text |
必选 |
播客的文本内容,最多支持 15000 个单词或汉字。 说明
|
|
use_head_music |
可选 |
是否在播客开头添加默认的音效,默认为 false。 |
输出参数说明如下表所示。
|
参数 |
说明 |
|---|---|
|
code |
返回状态码, |
|
data.content.podcast_url |
生成的播客音频的在线文件链接。 默认为 MP3 格式。 说明 生成的播客音音频 URL 有效期为 3 天,请及时转存。 |
|
data.content.text |
生成的播客文本内容。 |
|
usage.output_audio_tokens |
插件输出播客音频所消耗的 Token 数。 |
|
usage.input_text_tokens |
输入的内容和提示词所消耗的 Token 数。 |
|
log_id |
日志 ID,用于问题排查和调试。 |
|
msg |
执行插件时的状态描述或错误提示信息。 |
在工作流中添加语音播客插件中的 genPodcastURL 工具。输入播客的文本内容,语音播客插件输出生成的播客音频的在线文件链接。工作流的整体设计类似如下:
配置节点说明如下:
|
节点 |
说明 |
示例 |
|---|---|---|
|
开始节点 |
输入参数使用默认的 |
|
|
语音播客插件 |
添加语音播客插件中的 注意 超时时间需要设置为 600 s,因为生成播客的处理时间可能较长,若超时时间设置过短,容易出现超时错误。 |
|
|
选择器节点 |
如果 |
|
|
输出节点 |
输出节点的输出变量的值引用语音播客插件输出的 |
|
|
结束节点 |
结束节点输出变量的值引用语音识别插件输出的 |
|
基于输入的内容,生成语音播客,并流式返回音频内容。用户可以在语音通话过程中,通过语音指令,使智能体生成播客,例如输入“大学生暑假如何提升自己”,插件就能即时创作并生成语音播客。
输入参数说明如下表所示。
|
参数名称 |
是否必填 |
说明 |
|---|---|---|
|
input_text |
必选 |
播客的主题或内容,最多支持 15000 千个单词或汉字。 说明
|
|
use_head_music |
可选 |
是否在播客开头添加默认的音效,默认为 false。 |
输出参数说明如下表所示。
|
参数 |
说明 |
|---|---|
|
code |
返回状态码, |
|
data |
生成的播客音频。 默认格式为 PCM,采样率为 24 kHz。 |
|
log_id |
日志 ID,用于问题排查和调试。 |
|
msg |
执行插件时的状态描述或错误提示信息。 |
本文以搭建一个流式生成播客的智能体为例。
input_text 参数引用开始节点的 USER_INPUT 参数,用于输入生成播客的文本内容。注意
语音播客插件节点的超时时间需要设置为 600 s,因为生成播客的处理时间可能较长,若超时时间设置过短,容易出现超时错误。
|
错误码 |
错误描述 |
说明 |
|---|---|---|
|
702322003 |
并发数超过限制 |
|
|
702322002 |
输入的参数错误 |
|
- 语音播客插件 ID:7537547135328419903