助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

轨迹-工具利用率评估器

更新于: 2026-06-25 18:07:33

评估器信息

分类

详情

基础信息

评估器名称

轨迹-工具利用率

评估器类型

黑盒评估器,评估标准的明细不对客展示

效果说明

功能概述

本评估器会评测 Agent 运行轨迹中,各个 Model 节点声明好的预期调用工具列表里,实际使用的工具占比,并列出工具清单里,整个运行过程中都没有调用的工具

评估方式

Code/规则评估器

评估对象

Agent

评估目标

工具调用

应用场景

Agent 通用评测

评估规则说明

0<=X<=1分,0分代表注册工具全部没有调用,1分代表注册工具全部调用。具体样例如下:
正面样例:注册工具使用率为 1.00(使用个数 1 / 总注册个数 1)
反面样例:注册工具使用率为 0.36(使用个数 4 / 总注册个数 11),以下工具被注册但未使用:category_insight_report,planning_failed,generate_template_report,plan_finish_step,knowledge_search,plan_is_completed,content_strategy_gen_by_crowd_segment

评估置信度

100%

评估器参数说明

参数

参数名称

是否必填

参数说明

输入信息

trajectory

Agent 执行轨迹(必须遵循扣子罗盘定义的轨迹数据格式,详情参见 轨迹评测介绍

输出信息

result_str

评估分数和具体评估理由

输入格式 (Input Schema)

{
    "trajectory": {
        "content_type": "text",
        "json_schema": "{\"type\": \"string\"}",
        "text": "String格式的完整轨迹"
    }
}

输出格式 (Output Schema)

{
    "score" : 0.25 ,
    "reasoning" : "注册工具使用率为 0.25(使用个数 2 / 总注册个数 8),以下工具被注册但未使用:search_abtest_config,insight_search,retrieve_by_identifier,list_wiki_pages,get_wiki_page,search_wiki"
}