|
分类 |
详情 |
|
|---|---|---|
|
基础信息 |
评估器名称 |
知识问答-丰富度 |
|
评估器类型 |
黑盒评估器,评估标准的明细不对客展示 |
|
|
效果说明 |
功能概述 |
考察模型回复内容的信息量、广度和深度。一个丰富的回复不仅要准确回答用户的问题(满足主需求),还应围绕主题提供结构清晰、论据充分、视角多元的有效信息,并能进行适度的、有价值的延展,从而超出用户的基本预期,提供增益价值。丰富度反对空泛的套话、无意义的重复和信息的简单堆砌。 评估的三个层次: |
|
评估方式 |
复合评估器(LLM + Code) |
|
|
评估对象 |
文本 |
|
|
评估目标 |
内容质量 |
|
|
应用场景 |
AIGC 产物质量评估 |
|
|
评估规则说明 |
丰富度评分标准 |
|
|
评估置信度 |
90.00% |
|
|
参数 |
参数名称 |
是否必填 |
参数说明 |
|---|---|---|---|
|
输入信息 |
query |
是 |
用户输入内容 |
|
reply |
是 |
回复文本 |
|
|
输出信息 |
result_str |
评估分数和具体评估理由 |
{
"{{query}}": {
"content_type": "text",
"json_schema": "{\"type\": \"string\"}",
"text": "推荐一些北川当地有名的餐厅"
},
"{{reply}}": {
"content_type": "text",
"json_schema": "{\"type\": \"string\"}",
"text": "基于你对北川当地有名餐厅的需求,我从**特色程度、口碑评分、文化体验**三个不同维度为你筛选推荐..."
}
}
{
"score": "1.0",// 表示整体的评估分数
"reason": ""// 具体的评分依据
}