助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

体验扣子罗盘

更新于: 2026-06-24 15:45:09

扣子罗盘提供了演示空间,方便你快速了解扣子罗盘的各种功能。

说明

演示空间的数据为测试数据,仅供演示使用。

访问扣子罗盘体验空间

参考以下步骤,访问扣子罗盘体验空间。

  1. 访问扣子罗盘,然后单击右上角的立即体验
  2. 使用扣子账号登录。
    如果你尚未注册扣子账号,参考账号注册注册一个扣子账号并完成登录。
  3. 展开左侧导航栏顶部的空间列表,然后选择 Demo 空间
    如果是首次访问扣子罗盘,默认进入到 Demo 空间。
    Image
  4. 在显示的欢迎页面,单击立即体验,进入扣子罗盘的体验空间。
    Image

体验提示词开发

登录扣子罗盘后,默认进入到 Prompt 开发页面。在这里,你可以查看平台预设的 Prompt,单击详情了解 Prompt 的详细设计。扣子罗盘支持以 MessageList 的方式托管提示词模板,以满足复杂的业务场景。更多关于 Prompt 开发的详细说明,参考开发提示词
Image

体验评测功能

评测模块为开发者提供系统化的评测能力,能够对 Prompt 和扣子智能体的输出进行评测。你可以通过分析实验结果,深入研究异常案例,并进行有针对性的优化。
你可以切换到评测功能模块,体验扣子罗盘的评测能力。我们将按照评测实验流程引导你一步步体验扣子罗盘的评测功能。你也可以参考评测入门教程,发起一个评测实验。

查看评测集

要发起评测实验,需要先创建一个评测集,为评估对象添加测试数据。

  1. 在左侧导航栏,选择评测 > 评测集
  2. 评测集列表页面,单击详情查看已创建的评测集数据。
    Image
  3. 在详情页面,可查看评测数据。
    示例测试数据由输入数据(input 列)和理想的预期输出数据(reference_output)两列构成。其中输入数据作为评测对象的输入信息,预期输出数据作为评测标准参考。
    Image
  4. 单击关联实验页签,查看这个评测集的关联的实验结果。
    你可以通过不同维度的数据指标结果,综合分析评测对象的输出效果,有针对性的进行调优。
    Image

查看评估器

扣子罗盘支持使用大模型评估器对评估对象进行自动化评测。在准备好数据集后,就需要准备评估器,制定评测标准。

  1. 在左侧导航栏,选择评测 > 评估器
  2. 评估器列表页面,查看已创建的评估器。
    评估器支持版本管理。在发起评测实验时,可选择不同的评估器版本,针对评估器进行优化迭代。
    Image
  3. 单击详情,查看评估器配置。
  4. 在评估器配置页面,单击调试,输入构造的输入数据和标准输出数据,测试评估器效果。
    Image

查看评测实验

在准备好评测集和评估器后,就可以对评估对象发起评测实验了。扣子罗盘支持对 Prompt 和扣子智能体进行评估。

  1. 在左侧导航栏,选择评测 > 实验
  2. 实验列表页面,查看已发起的评测实验。
    Image
  3. 选择一个评测实验,单击详情查看评测结果。
  4. 扣子罗盘支持对评测结果进行人工校准。选择要要校准的目标数据,然后单击人工校准的编辑图标。
    Image
  5. 单击指标统计查看实验报告。
    扣子罗盘会根据实验结果自动生成可视化看板,方便对测试结果进行分析,进行决策。
    Image

体验观测功能

扣子罗盘为开发者提供了全链路执行过程的可视化观测能力,完整记录从用户输入到 AI 输出的每个处理环节。

查看 Trace

观测功能支持平台提示词(Prompt)开发、扣子智能体、扣子 AI 应用的数据自动上报,也支持通过集成 SDK 上报其他框架(Eino/Langchain)开发的 AI 应用。详情请参考SDK 概述
观测 > Trace 页面,选择时间范围、任务节点范围和观测对象,查看已上报的 Trace 数据。关于 Trace 数据的详细说明,参考Trace 信息说明
Image

查看统计数据

扣子罗盘提供了不同维度的统计指标看板,可直观了解观测对象的运行情况和成本消耗。
Image