助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

视频生视频-指令遵循评估器

更新于: 2026-06-25 18:07:33

评估器信息

分类

详情

基础信息

评估器名称

视频生视频-指令遵循

评估器类型

黑盒评估器,评估标准的明细不对客展示

效果说明

功能概述

视频生视频需评估生成结果对用户诉求的遵循能力,核心指标包括:主体遵循,属性遵循度,背景遵循度,结构遵循度

评估方式

复合评估器(LLM + Code)

评估对象

图片

评估目标

内容质量

应用场景

AIGC 产物质量评估

评估规则说明

评估生成结果对用户诉求的遵循能力,核心指标包括:①主体遵循度:核心人物/动物/物体是否出现、身份是否正确、数量是否匹配;图生视频若有参考图,需严格一致(人脸/外观)。②属性遵循度:服装颜色材质、动作姿态与幅度、交互、表情、风格等细节是否符合;动作判定需极严(站/坐等),若要求说话则口型运动应自然。③背景遵循度:场景环境、光影、天气是否吻合,并检查是否存在不自然切换、模糊或破绽。④结构遵循度:镜头推拉摇移、视角选择、时序逻辑与空间布局是否合理连贯。⑤约束遵循度:否定指令、排除项及数量/范围限制是否被严格满足。

  • 4分 (完美) :所有考察点均满足。
  • 3分 (优秀) :所有重要考察点满足,存在次要考察点不满足。
  • 2分 (一般) : 任意 重要考察点不满足 (默认上限)。
  • 1分 (差) :核心重要考察点严重违反或多个重要考察点不满足,但画面仍有相关性。
  • 0分 (极差) :核心需求完全缺失、严重幻觉、完全不可用。

评估置信度

80.00%

评估器参数说明

参数

参数名称

是否必填

参数说明

输入信息

query

用户指令

reference_imgs

用户输入图片

reference_videos

用户输入视频

reply_videos

生成的视频视频

输出信息

result_str

评估分数和具体评估理由

输入格式 (Input Schema)

{
    "{{query}}": {
        "content_type": "text",
        "json_schema": "{\"type\": \"string\"}",
        "text": "帮我生成一个视频。将视频中的老人替换为穿牛仔衣的年轻男子,同步原视频的说话、手势动作,保留原场景光影。帮我生成一个视频。时长 5s,模型 2.0。"
    },
    "{{reference_imgs}}": {
        "content_type": "multi_part",
        "multi_part": [
            {
               "content_type": "image",
               "image": {
                 "url": "https://lf-stark-public.bytetos.com/obj/stark-public/images/1768995934.png_1769002973"
               }
            },
            {
               "content_type": "image",
               "image": {
                 "url": "https://lf-stark-public.bytetos.com/obj/stark-public/images/1768997519.png_1769002973"
               }
            },
            {
               "content_type": "image",
               "image": {
                 "url":  "https://lf-stark-public.bytetos.com/obj/stark-public/images/1768997515.png_1769002974"
               }
            },
            {
               "content_type": "image",
               "image": {
                 "url": "https://lf-stark-public.bytetos.com/obj/stark-public/images/1768997517.png_1769002974"
               }
            }
        ]
    },
    "{{reference_videos}}": {
        "content_type": "multi_part",
        "multi_part": [
            {
                "content_type": "video",
                "video": {
                    "url": "https://lf-stark-public.bytetos.com/obj/stark-public/z-project/v2v/videos/ogvlQ7gZfRIuzVVWLDxpsVBexEANFpi5Dc4EW7.mp4"
                }
            }
        ]
    },
    "{{reply_videos}}":  {
        "content_type": "multi_part",
        "multi_part": [
            {
                "content_type": "video",
                "video": {
                    "url": "https://lf-stark-public.bytetos.com/obj/stark-public/kling_20260116_%E4%BD%9C%E5%93%81_%E6%8A%8A_%E8%A7%86%E9%A2%911_%E4%B8%AD%E7%9A%84%E5%B0%8F%E5%A5%B3_4573_0.mp4"
                }
            }
        ]
    }
}

输出格式 (Output Schema)

{
  "最终得分": "0",// 表示整体的评估分数
  "打分细节": "", //具体的评分依据
  "782": {}, //主体遵循度的评估分数和理由
  "783": {}, //属性遵循度的评估分数和理由
  "784": {}, //结构遵循度的评估分数和理由
  "785": {}, //约束遵循度的评估分数和理由
}