贝乐虎:扣子罗盘赋能儿童智能伙伴,安全效率双升级
更新于: 2026-06-24 21:03:16
贝乐虎深耕儿童领域,构建了涵盖动画、音乐、音频、互动课程、智能硬件等多形态的儿童内容生态,服务 1.3 亿 APP 用户及全球海量家庭。通过接入扣子罗盘,贝乐虎实现了儿童专属智能伙伴 Agent 的系统化调优,在响应准确率、内容安全性、开发协作效率等维度实现显著提升,为 0-8 岁儿童提供安全、教育、陪伴一体化的成长服务。
客户介绍
贝乐虎是乐擎网络科技(上海)有限公司旗下核心儿童内容品牌,公司以 “快乐陪伴,寓教于乐” 为理念,打造了贝乐虎、宝贝多米等多个热门 IP。业务覆盖动画、音乐、互动课程、智能硬件等多形态内容,儿歌动画数千集,视频播放量超 1500 亿次,APP 用户规模上亿,合作渠道覆盖腾讯视频、华为、TCL 等主流平台及海外 YouTube。
为进一步升级儿童成长陪伴体验,贝乐虎依托大模型与多模态感知技术,打造专属儿童的智能伙伴 Agent, 通过“APP + 智能硬件” 的全域覆盖,为孩子提供安全、趣味、个性化的成长陪伴。
业务挑战
在搭建智能陪伴 Agent 的过程中,贝乐虎团队遇到了以下问题:
- 响应准确率不足:Agent 需要准确理解儿童模糊的需求,还要快速关联海量内容资源,但传统人工调试很难发现共性问题,导致同类错误反复出现。
- 内容安全要求严格:作为面向儿童的产品,Agent 必须严格过滤敏感内容,但人工检测的样本量有限,很难覆盖到边缘场景和多样的提问方式。
- 开发协作效率低:混合技术架构下,问题调试依赖人工复现,排查故障耗时久。
- 缺乏系统化评测:Agent 没有固定迭代周期,版本质量也无法量化衡量。
解决方案
针对贝乐虎在开发儿童智能伙伴 Agent 时遇到的核心痛点,扣子罗盘提供了一套覆盖 Agent 全流程优化的综合解决方案,具体包含以下三个关键功能:
- 自动化批量评测实验:围绕性能、安全拦截、意图理解、token 消耗数等指标,构建适合儿童场景的自动化评测体系,日均覆盖上千个评测样本,全面校验边缘场景与争议性回复。
- Prompt 对比调优:通过扣子罗盘的对比模式,快速比较不同 Prompt 在同一模型上的输出差异,针对性改进回复效果,确保内容符合儿童的认知习惯。
- 全链路问题追踪:用唯一的 Trace ID 追踪 Agent 交互的整条链路,实现问题可追溯、过程可复盘。故障节点和调试数据可以被实时同步给协作团队。
客户收益
通过扣子罗盘的系统化调优,贝乐虎在 Agent 性能、内容安全、开发效率等维度实现量化提升:
- Agent 响应准确率显著提升:大模型稳定性提升 30%,同类错误重复发生率显著下降,Agent 能精准响应儿童需求并快速匹配动画、课程等资源,保障陪伴与学习场景的流畅体验。
- 内容安全边界更加牢固:大模型输出争议内容的频率降低 15%,儿童隐私保护与敏感内容拦截能力大幅增强,通过海量样本测试满足儿童产品严苛安全要求,让家长更放心。
- 更高效的开发与协作流程:大模型幻觉概率降低 20%,故障定位与修复时间大幅缩短,Trace ID 链路回溯打破信息同步壁垒,减少人工调试成本,让团队聚焦核心业务优化。
- 建立系统化评测体系:实现问题全链路追溯与过程完整复盘;通过自动化批量评测与记录体系推动目标导向的持续优化;建立常态化评测分析周期,确保版本迭代的规律性与质量可控性。
客户原声
“扣子罗盘的系统化调优让我们在Agent调试上少走了很多弯路,模型稳定性和内容安全性都达到了预期,团队协作效率也明显提升。”—— 贝乐虎技术团队