扣子编程提供了各类主流的大语言模型,如豆包模型、DeepSeek 模型、Kimi 模型等。你无需任何配置,扣子 AI 会自动为你的 AI 编程项目接入 AI 能力,满足文本生成、语义理解、多轮对话等核心 AI 需求。
以下操作将消耗你的扣子积分。
在扣子编程中,你只需输入开发 AI 编程项目的指令,扣子 AI 会自动为项目接入内置集成中的大语言模型。例如输入指令:
开发一个阅读笔记总结工作流,通过大模型可以将获取到的文章内容进行总结、提炼,并输出总结笔记
接入大模型能力后,你可以精细化设置大语言模型的参数,例如生成随机性、Top P 和最大回复长度等。各个模型支持调整的参数不同,具体以界面为准。
例如在智能体的预览页面,单击模型名称,然后单击设置图标,可以设置模型参数,参数说明如下表所示。
|
配置项 |
说明 |
|---|---|
|
生成随机性 |
即 temperature,用于控制生成结果的随机性。取值范围:0~2。
在基于事实的问答场景,你可以使用较低的回复随机性数值,以获得更真实和简洁的答案,例如售后客服场景;在创造性的任务(如小说创作)中,你可以适当调高回复随机性数值。 |
|
重复语句惩罚 |
frequency penalty,用于控制模型输出重复语句的频率。 |
|
Top P |
累计概率。 |
|
最大回复长度 |
大模型在生成提示和响应时,所输出的最大 Tokens 数量,不同模型的 Tokens 限制也不同。指定最大长度可以防止过长或不相关的响应并控制成本。 |
|
最大推理&回答长度 |
如果开启了深度思考,可以通过该参数限制模型“思维链推理过程+最终回复内容”的最大 Tokens 消耗,避免因过度推理造成资源浪费。 |
|
深度思考开关 |
部分支持深度思考的模型,开发者可以选择开启或关闭深度思考,从而灵活控制模型在交互过程中的 Token 消耗。
|
|
深度思考程度 |
精细化控制思维链的推理深度与步骤数量,仅在深度思考开关为开启或自动时生效。
|
|
输出格式 |
指定模型输出内容的格式,例如文本、json object、json schema。 |
部分模型支持开启上下文缓存功能。通过缓存常用上下文信息,可减少每次请求时重复处理的加载开销,加快模型的响应速度,降低模型使用成本,计费详情请参考大语言模型。
模型默认不开启上下文缓存,你可以通过自然语言对话方式,让扣子 AI 开启模型的缓存功能。例如输入如下指令:
为模型开启缓存功能
开启后,你可以在智能体的 agent.py 文件或工作流的 node.py 文件中确认缓存是否开启成功。如果添加了 caching 配置和use_responses_api=True参数,则表示开启了模型缓存功能。
在扣子编程的集成管理页面,单击目标大语言模型,即可在模型详情页签下查看该模型的详细信息,包括价格、限制和能力等。
你可以通过模型用量看板追踪模型的用量。该看板会展示模型在当前工作空间的各个 AI 编程项目中的具体用量,包括输入 tokens、输出 tokens 和消耗 tokens,并支持按照输入 tokens、输出 tokens、消耗 tokens 维度进行排序。
当某个模型即将停运时,工作空间的所有者或管理员可以快速定位当前工作空间下所有使用该模型的 AI 编程项目,并批量为这些项目的线上版本切换模型。模型停运 7 天内,仍支持批量切换模型。
说明
切换完成后,状态将更新为项目已完成模型切换。新模型的用量图表数据将在次日自动更新。