助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

轨迹-工具重复调用率评估器

更新于: 2026-06-25 18:07:33

评估器信息

分类

详情

基础信息

评估器名称

轨迹-工具重复调用率

评估器类型

黑盒评估器,评估标准的明细不对客展示

效果说明

功能概述

本评估器会评测 Agent 运行轨迹中,工具的重复调用情况,并计算得出有重复调用的工具、重复次数。
其中,重复调用的定义是任一工具调用>1次,工具重复调用次数=所有工具总调用次数-{{调用工具数}},重复调用率=工具重复次数/所有工具总调用次数,得分=1-重复调用率

评估方式

Code/规则评估器

评估对象

Agent

评估目标

工具调用

应用场景

Agent 通用评测

评估规则说明

0<X<=1分,越靠近0分越代表工具重复调用严重,1分代表工具没有重复调用的情况。具体样例如下:
正面案例:除了每个工具的第一次调用以外,重复调用比率为 1.00(重复调用次数 0 / 总调用次数 1)
反面案例:除了每个工具的第一次调用以外,重复调用比率为 0.34(重复调用次数 2 / 总调用次数 3),重复的工具:tavily_search 重复了 2 次

评估置信度

100%

评估器参数说明

参数

参数名称

是否必填

参数说明

输入信息

trajectory

Agent 执行轨迹(必须遵循扣子罗盘定义的轨迹数据格式,详情参见 轨迹评测介绍

输出信息

result_str

评估分数和具体评估理由

输入格式 (Input Schema)

{
    "trajectory": {
        "content_type": "text",
        "json_schema": "{\"type\": \"string\"}",
        "text": "String格式的完整轨迹"
    }
}

输出格式 (Output Schema)

{
    "score" : 0.8 ,
    "reasoning" : "除了每个工具的第一次调用以外,重复调用比率为 20%(重复调用次数 2 / 总调用次数 10),重复的工具:retrieve_by_identifier"
}