助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

图生图-一致性评估器

更新于: 2026-06-25 18:07:33

评估器信息

分类

详情

基础信息

评估器名称

图生图-一致性

评估器类型

黑盒评估器,评估标准的明细不对客展示

效果说明

功能概述

支持按参考图生成单/多图场景,判断生图和参考图之间的一致性,包括主题一致性,属性一致性,风格一致性维度考察
主题一致性
衡量生成内容中未被指令要求修改的区域,其主体内容、物体轮廓、空间布局等是否得到精准保留。 评价要点:未修改区域的主要物体是否与原图一致。各物体的轮廓、大小、比例及彼此间距离是否保持原样。是否存在结构性错位、主体缺失、拼接异常等现象。
属性一致性
衡量未被指令要求修改区域的内容、物体属性细节的保留情况。属性包括但不限于物体器官、动作、姿态、发色、组成部件等物体结构,关注原始图像细节的完整性和准确性。 评价要点:物体属性是否与原图一致。是否出现细节丢失、模糊、属性漂移等现象。
风格一致性
衡量生成结果整体在视觉风格上的连贯性与原图的相似程度。主要考查色彩基调、光影氛围、画面质感、笔触表现、细腻度、锐度、艺术表现手法等方面,判断生成图与原图是否属于同一审美体系,是否有违和、拼贴、风格漂移等问题。评价要点整体画面质感(如颗粒感、清晰度、平滑度)、画风(写实 / 卡通 / 油画 / 赛博等)是否连贯。色彩基调、光影氛围、明暗、对比度色温、饱和度等艺术风格元素是否与原图匹配。有无明显风格断层、拼贴感或局部风格突变。

评估方式

复合评估器(LLM + Code)

评估对象

图片

评估目标

内容质量

应用场景

AIGC 产物质量评估

评估规则说明

手动选择输入,若涉及打分,需说明总分范围、评分维度(含权重)、计算公式及结果解读(如优秀/良好/需改进的分数区间);若为分类/检测类评估器,则说明具体规则

评估置信度

85.00%

评估器参数说明

参数

参数名称

是否必填

参数说明

输入信息

query

用户输入内容

check_points

待评估的考察点

reference_imgs

用户输入的参考图片list

reply

回复文本

reply_imgs

回复图片list

输出信息

score

评估分数

reasoning

具体评估理由

输入格式 (Input Schema)

{
    "{{query}}": {
        "content_type": "text",
        "json_schema": "{\"type\": \"string\"}",
        "text": "把图中的碗变小"
    },
    "{{reply_imgs}}": {
        "content_type": "multi_part",
        "multi_part": [
            {
                "content_type": "image",
                "image": {
                    "url": "https://lf-stark-public.bytetos.com/obj/stark-public/vlm_benchmark/Instructions/output_7.png"
                }
            }
        ]
    },
    "{{reference_imgs}}": {
        "content_type": "multi_part",
        "multi_part": [
            {
                "content_type": "image",
                "image": {
                    "url": "https://lf-stark-public.bytetos.com/obj/stark-public/vlm_benchmark/Instructions/input_7.png"
                }
            }
        ]
    }
}

输出格式 (Output Schema)

{
  "score": "0",// 表示整体的评估分数
  "reasoning": "", //具体的评分依据
}