|
分类 |
详情 |
|
|---|---|---|
|
基础信息 |
评估器名称 |
知识问答-便捷性 |
|
评估器类型 |
黑盒评估器,评估标准的明细不对客展示 |
|
|
效果说明 |
功能概述 |
考察回复的结构组织是否合理,「主需」的内容在结构和位置上是否突出,便于阅读。如:大篇幅排版混乱、主需位置靠后等,导致用户无法快速找到主需信息 |
|
评估方式 |
复合评估器(LLM + Code) |
|
|
评估对象 |
文本 |
|
|
评估目标 |
内容质量 |
|
|
应用场景 |
AIGC 产物质量评估 |
|
|
评估规则说明 |
手动选择输入,若涉及打分,需说明总分范围、评分维度(含权重)、计算公式及结果解读(如优秀/良好/需改进的分数区间);若为分类/检测类评估器,则说明具体规则 |
|
|
评估置信度 |
93.00% |
|
|
参数 |
参数名称 |
是否必填 |
参数说明 |
|---|---|---|---|
|
输入信息 |
query |
是 |
用户输入内容 |
|
reply |
是 |
模型的回复文本 |
|
|
输出信息 |
result_str |
是 |
评估分数和具体评估理由 |
{
"{{query}}": {
"content_type": "text",
"json_schema": "{\"type\": \"string\"}",
"text": "今天天气怎么样"
},
"{{reply}}": {
"content_type": "text",
"json_schema": "{\"type\": \"string\"}",
"text": "今天天气20度"
}
}
{
"总体得分": "0",// 表示整体的评估分数
"269": {}, //结构合理性评估结果
"270": {} //文本瑕疵评估结果
"275": {} //格式瑕疵评估结果
}