助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

预置评估器

更新于: 2026-06-24 15:45:09

扣子罗盘内置了多种评估器 Prompt 模板,开发者可以在评测实验中直接使用这些模板,也可以基于这些预置评估器二次开发,打造符合自己业务场景的自建评估器。本文档介绍预置评估器的概念与使用方式。

什么是预置评估器

为了便于开发者快速创建各种评测场景的实验,扣子罗盘提供了一系列的预置评估器,适用于文本、图片、音视频等多种评估对象,覆盖了安全风控、AI coding 等多种业务场景。
你可以在扣子罗盘的评估器 > 预置评估器页面中查看预置评估器列表,你还可以通过评估器名称、类型、评估对象等维度来快速查找和筛选评估器。
Image

调试预置评估器

在评测实验中使用预置评估器之前,你可以先简单调试预置评估器,测试其效果是否符合业务要求。

  1. 访问扣子罗盘,并在左侧导航栏顶部,选择一个空间。
  2. 在左侧导航栏,选择评测 > 评估器。
  3. 进入预置评估器页面,选择你想调试的预置评估器。
    支持根据评估对象、评估目标、任务场景以及评估器名称的关键词筛选预置评估器。
    Image
  4. 查看评估器的 Prompt 等详细信息,确认无误后在右上角单击调试
    Image
  5. 确认模型和 Prompt,并输入测试数据,单击运行
    Image
  6. 在测试区域下方查看评估器调试结果。
    Image

使用预置评估器

对于 Agent 任务完成度等常见的典型评测场景,你可以直接在评测实验中使用扣子罗盘提供的预置评估器,而无需手动创建评估器、编写 Prompt 作为评估标准。
创建评估实验时,选择基础信息、评测集和评测对象之后,你可以在评估器页面中选择预置评估器来开展评估实验。详细操作步骤可参考创建实验
Image