模型/模型服务
模型服务
更新于: 2026-06-24 15:44:40
在扣子编程中搭建的智能体和 AI 应用都是基于模型技术开发的应用程序。通过扣子编程,你可以便捷使用各个厂商提供的模型服务,个人版用户可使用豆包、DeepSeek 等模型服务,企业标准版、企业旗舰版用户在此基础上还可以使用火山引擎方舟平台的其他模型资源,例如豆包视觉模型、豆包文生图模型等。
你可以通过智能体、工作流节点、插件等方式使用模型服务:
本文档介绍扣子编程中可使用的各种模型服务。
在扣子编程使用模型服务,根据模型的类型与版本收取不同的费用。详细计费策略,可参考模型费用。
购买企业标准版、企业旗舰版之后,你可以开通火山引擎方舟平台提供方舟模型版本,例如豆包语音识别模型、语音合成模型、DeepSeek 模型等,可接入的模型列表参考方舟模型发布公告,接入模型的方式可参考接入火山方舟模型。
扣子模型指扣子编程面向用户统一提供的模型服务。
说明
|
供应商 |
模型名称 |
模型版本 |
模型类型 |
高级功能配置 |
说明 |
|---|---|---|---|---|---|
|
字节跳动 |
豆包·2.0·Code |
doubao-seed-2.0-code |
多模态模型 |
|
豆包·2.0·Code 面向企业级编程需求优化,在 Seed 2.0 优秀的 Agent、VLM 能力基础上,特别增强了代码能力,不仅前端能力表现出众,也对企业常见的多语言编码需求做了特别优化,适合接入各种 AI 编程工具使用。 |
|
豆包·2.0·pro |
doubao-seed-2.0-pro |
多模态模型 |
|
豆包·2.0·pro 是旗舰级全能通用模型,面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出,可稳定应对多步复杂规划、复杂图文推理、视频内容理解与高难度分析等场景。 |
|
|
豆包·2.0·lite |
doubao-seed-2.0-lite |
多模态模型 |
|
豆包·2.0·lite 是面向高频企业场景兼顾性能与成本的均衡型模型,综合能力超越上一代Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作,支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。 |
|
|
豆包·2.0·mini |
doubao-seed-2.0-mini |
多模态模型 |
|
豆包·2.0·mini 面向低时延、高并发与成本敏感场景,强调快速响应与灵活推理部署。模型效果与Doubao-Seed-1.6相当。支持256k上下文、4档思考长度和多模态理解,适合成本和速度优先的轻量级任务。 |
|
|
豆包·1.8·深度思考 |
doubao-Seed-1.8-251228 |
多模态模型 |
|
豆包·1.8·深度思考模型是体验 Agentic 能力大幅增强的新一代多模态深度思考模型。其工具调用、指令遵循、视觉理解能力大幅提升,幻觉减少,更适合企业级任务。模型同时支持 minimal、low、medium、high 四种模式,适合企业级任务、服务复杂任务和有挑战场景。 |
|
|
豆包·编程 |
Doubao-Seed-Code |
多模态模型 |
|
豆包·编程模型面向 Agentic 编程任务进行了深度优化,在 Terminal Bench、SWE-Bench-Verified-Openhands、Multi-SWE-Bench-Flash-Openhands 等多项权威基准测试中表现优异。 |
|
|
豆包·1.6·极致速度·250828 |
Doubao-seed-1.6-flash-250828 |
多模态模型 |
|
豆包·1.6·极致速度·250828 模型是综合能力最强的 flash 版本。相比 250615、250715 版本,在文本和视觉方面的能力显著提升近 10%。 |
|
|
豆包·1.6·思考深度调节 |
doubao-seed-1-6-251015 |
多模态模型 |
|
豆包·1.6·思考深度调节模型支持调节思考长度,即支持 API 中的 reasoning_effort 字段,分为 minimal、low、medium、high 四种模式。该模型还支持压缩整体输出长度,平衡客户在不同场景下对效果、时延、成本的需求。 |
|
|
豆包·1.6·自动深度思考 |
Doubao-Seed-1.6-250615 |
多模态模型 |
|
Doubao-Seed-1.6 全新多模态深度思考模型,支持 256k 上下文窗口,输出长度支持最大 16k tokens。支持开启/关闭深度思考功能,或设置为自动。 |
|
|
豆包·1.6·极致速度 |
doubao-1-6-flash-250615 |
多模态模型 |
|
推理速度极致的多模态深度思考模型,TPOT 仅需 10ms; 同时支持文本和视觉理解,文本理解能力超过上一代 lite,视觉理解比肩友商pro 系列模型。支持 256k 上下文窗口,输出长度支持最大 16k tokens。 |
|
|
豆包·1.6·视觉理解·250815 |
doubao-seed-1-6-vision-250815 |
多模态模型 |
上下文缓存(Responses API) |
豆包·1.6·vision·250815 模型适用于视频理解、Grounding、GUI Agent 等高复杂度的场景,与 Doubao-1.5-thinking-vision-pro 相比,在教育、图像审核、巡检与安防、AI 搜索问答等场景展现出更强的通用多模态理解和推理能力。最大上下文长度 256k,最大输出长度 64k tokens。 |
|
|
豆包·1.5·Pro·32k |
Doubao-1.5-pro-32k |
文本模型 |
上下文缓存(Context API) |
Doubao-1.5-pro-32k,全新一代主力模型,性能全面升级,在知识、代码、推理、等方面表现卓越。支持32k上下文窗口,输出长度支持最大12k tokens。 |
|
|
豆包·1.5·Lite·32k |
Doubao-1.5-lite-32k/250115 |
文本模型 |
上下文缓存(Context API) |
Doubao-1.5-lite-32k/250115,全新一代轻量版模型,极致响应速度,效果与时延均达到全球一流水平。支持 32k 上下文窗口,输出长度支持最大 12k tokens。 |
|
|
豆包·1.5·Pro·视觉推理·128K |
Doubao-1.5-thinking-pro/m-250415 |
多模态模型 |
无 |
Doubao-1.5-thinking-pro/m-250415,基于深度思考+视觉理解的混合训练,让模型具备视觉推理能力,更强的多模态交互能力,和更低的视觉描述幻觉。 |
|
|
豆包·1.5·Pro·视觉理解 |
Doubao-1.5-pro-vision-32k/250115 |
多模态模型 |
无 |
Doubao-1.5-pro-vision-32k/250115,具备强大的图片理解与推理能力,以及精准的指令理解能力。模型在图像文本信息抽取、基于图像的推理任务上有展现出了强大的性能,能够应用于更复杂、更广泛的视觉问答任务。 |
|
|
豆包·1.5·Pro·角色扮演·250715 |
Doubao-1.5-pro-32k-character-250715 |
文本模型 |
无 |
新增故事剧情模式、恋爱拉扯、真人向聊天优化,整体效果提升10~15%。 |
|
|
豆包·通用模型·Lite |
Doubao-lite |
文本模型 |
无 |
轻量级大模型,拥有极致的响应速度,更好的性价比,为客户不同场景提供更灵活的选择。支持 32k 上下文窗口的推理和精调。 |
|
|
深度求索 |
DeepSeek-V3 工具调用 |
V3 functionCall 版本 |
文本模型 |
无 |
V3 functionCall 版本,支持在Single-Agent模式下调用各类扣子工具(插件、工作流、知识库等)。 |
|
DeepSeek-V3.2 |
DeepSeek-V3.2 |
文本模型 |
|
深度求索推出的首个将思考融入工具使用的混合推理模型,用高效架构省算力、大规模强化学习提能力、大规模合成任务数据强泛化,三者结合性能媲美 GPT-5-High,输出长度大幅降低,显著减少了计算开销与用户等待时间。 |
|
|
阶跃星辰 |
阶跃星辰 · 1.5v · 视频理解 |
step-1.5v-mini |
多模态模型 |
无 |
阶跃星辰·1.5v 是一款多模态大模型,专注于视频理解和图像分析。该模型具备强大的感知能力,能够准确识别视频中的物体、人物及环境,并理解整体氛围和情感。 |
|
阶跃星辰 · 1v · 图片理解 |
step-1v-8k |
多模态模型 |
无 |
阶跃星辰·1v 是一款多模态大模型,专注于图像分析。该模型具备强大的感知能力,能够准确识别图片的物体、人物及环境,并理解整体氛围和情感。 |
|
|
月之暗面 |
Kimi-8k |
moonshot-v1-8k |
文本模型 |
无 |
Kimi(8K)模型提供高容量的语言处理能力,适合处理大规模文本数据。它具备视觉能力、广泛的知识面和先进的推理能力,能准确地解决复杂问题。 |
|
Kimi-32k |
moonshot-v1-32k |
文本模型 |
无 |
Kimi(32K)模型进一步扩展了处理能力,适用于更复杂的语言任务和更大的数据集。它具备视觉能力、广泛的知识面和先进的推理能力。 |
|
|
Kimi-128k |
moonshot-v1-128k |
文本模型 |
无 |
Kimi(128K)模型拥有极高的参数量,能够处理极其复杂的语言理解和生成任务。它具备视觉能力、广泛的知识面和先进的推理能力。 |
|
|
智谱 AI |
GLM-4.7 |
GLM-4.7 |
多模态模型 |
无 |
GLM-4.7 是智谱最新旗舰模型,面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得开源模型中的领先表现。通用能力提升,回复更简洁自然,写作更具沉浸感。在执行复杂智能体任务,在工具调用时指令遵循更强,Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。 |
购买扣子企业旗舰版后,你可以将自部署或第三方在线模型集成至扣子编程,进一步拓展扣子可用的模型范围,具体请参见接入自定义模型。
此外,扣子编程还通过官方插件等方式提供了一些多模态模型供开发者使用。你可以直接为智能体绑定插件,并在人设与提示词中声明插件的使用场景,扣子编程智能体将在指定的对话场景下自动调用插件处理数据。那你也可以在编排工作流时添加插件节点,在流程中固定使用插件处理数据。详细说明可参考插件介绍。
常用的官方模型插件如下:
|
插件名称 |
插件说明 |
模型插件效果 |
|---|---|---|
|
Doubao-Seedream-4.0 插件采用新一代图像创作模型 Seedream 4.0,能够灵活应对复杂的多模态生成任务(新增知识生图、复杂推理和参考图一致性等)。 |
|
|
|
视频生成插件采用 doubao-seedance-1.0-pro 和 doubao-seedance-1.0-lite 模型,支持基于文本提示词生成视频,也支持基于文本提示词、视频首帧、尾帧图片或参考图共同生成视频。 |
|
|
|
豆包文生音乐可以根据用户输入生成音乐。 |
提示词:生成一段 pop 曲风、思乡主题、女性演唱者、氛围轻松愉快的音乐 |
|
|
Doubao-图像生成插件是一款强大的 AI 图像助手,提供两大核心功能:
无论是修改已有图片还是从零创作,豆包都能帮您轻松实现图像创意。 |
图片生成工具:
|
|
|
图片编辑工具: |
||
|
一款通过解析特定URL上的图片内容并为其生成含义且相关的文本描述的插件。它使用了先进的机器视觉和自然语言处理技术,旨在帮助用户理解图片的主要内容。 |
|
|
|
根据文本描述生成图像,可指定图像数量和大小。 |
提示词:卡通风格,小猫 |
|
|
指令编辑是一款能够通过自然语言修改图片内容的插件。用户只需提供原图和对画面内容调整的建议,该插件即可自动对图片进行修改,无需用户具备专业的图片编辑技能。 |
|
默认情况下,用户在工作空间中可使用模型管理页面中展示的所有模型,空间所有者和管理员可以限制空间内可用的模型。你可以在模型管理页面,开启或关闭某个模型。暂不支持批量开启或关闭模型。
模型管理功能入口如下所示:
个人版
在旧版扣子编程的左侧导航栏中,单击空间配置,然后在顶部选择模型管理,单击目标模型右侧的开关,可以开启或关闭模型。
企业版
在扣子编程顶部选择目标工作空间,单击当前空间配置管理图标,然后在顶部选择模型管理,单击目标模型右侧的开关,可以开启或关闭模型。
在智能体或工作流大模型节点中选择模型时,查看模型的类别即可区分方舟模型和扣子模型。
|
模型类型 |
说明 |
示例 |
|---|---|---|
|
方舟模型 |
由企业标准版、企业旗舰版用户在火山方舟侧通过创建接入点的方式自行接入的模型,被称为方舟模型。 |
|
|
扣子模型 |
由扣子统一对接、面向所有扣子用户提供的模型服务,均为扣子模型。通常来说,除火山方舟以外的模型,均为扣子模型。 |
|
你可以为智能体、工作流大模型等节点设置或切换模型。具体操作方式如下:
|
操作类型 |
说明 |
示例 |
|---|---|---|
|
为智能体设置模型 |
在智能体的编排页面顶部区域,单击模型名称为智能体选择模型。 |
|
|
在模型的用量记录图表中,单击目标智能体名称,跳转至对应的智能体编排页面,进行模型替换。具体操作,请参考如何快速切换待下架模型?。 |
|
|
|
为工作流模型节点设置模型 |
工作流大模型节点中,在模型区域为节点设置模型。 |
|
|
在模型的用量记录图表中,单击目标工作流名称,跳转至对应的工作流编排页面,进行模型替换。具体操作,请参考如何快速切换待下架模型?。 |
|