资源/知识库/知识库概述
更新于: 2026-06-24 15:44:40
扣子编程支持使用扣子编程官方知识库和火山知识库,两者均支持上传和存储外部知识内容,并提供了多种检索能力。扣子编程的知识能力可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。

功能概述
知识库功能包含两个能力,一是存储和管理外部数据的能力,二是增强检索的能力。
- 数据管理与存储
扣子编程支持从多种数据源渠道上传文本和表格数据,例如本地文档、在线数据、Notion、飞书文档等。上传后,扣子编程可将知识内容自动切分为一个个内容片段进行存储,同时支持用户自定义内容分片规则,例如通过分段标识符、字符长度等方式进行内容分割。
- 增强检索
扣子编程的知识功能还提供了多种检索方式来对存储的内容片段进行检索,例如使用全文检索通过关键词进行内容片段检索和召回。
大模型会根据召回的内容片段生成最终的回复内容。
应用场景
扣子编程支持上传文本内容和结构化的表格数据,可满足不同的使用场景。例如:
- 语料补充:如需创建一个虚拟形象与用户交流,你可以在知识库中保存该形象相关的语料。后续智能体会通过向量召回最相关的语料,模仿该虚拟形象的语言风格进行回答。
- 客服场景:将用户高频咨询的产品问题和产品使用手册等内容上传到知识库,智能体可以通过这些知识精准回答用户问题。
- 垂直场景:创建一个包含各种车型详细参数的汽车知识。当用户查询某一车型的百公里油耗是多少时,可通过该车型召回对应的记录,然后进一步识别出百公里油耗。
知识与记忆对比
扣子编程的知识和记忆能力都可以用来存储数据。在使用时可以从最终的使用者和存储的数据内容上进行区分。
- 知识:知识是供智能体或工作流调用的静态数据,可在空间内共享。由开发者创建和维护,智能体的终端用户无法对知识内容进行修改。
- 记忆:扣子编程提供了数据库、变量、长期记忆等记忆功能。通常这些数据是智能体的终端用户在使用智能体时产生的动态数据,不支持跨智能体使用。
以一个租房平台的智能体为例,下表展示了哪些数据是需要通过知识功能来维护的,哪些数据是通过记忆功能来维护的。
|
类别
|
存储的数据
|
特点
|
|
知识
|
- 周边所有的房屋的信息(房屋面积、朝向、租房价格等)
- 周边所有小区的信息(小区位置、小区年代、周边交通等)
- 某地区租房政策文件信息
- 官方租房介绍文档
- …
|
- 由智能体开发者上传和维护
- 所有用户可见但不可修改
- 可跨智能体使用
|
|
记忆
|
- 用户租房喜好(位置、面积、是否带独卫等)
- 用户历史租房信息
- 用户关注的小区/房屋
- …
|
|
知识库类型
扣子编程支持使用扣子知识库和火山知识库,两者均用于存储、管理和高效检索各类信息资源。
- 扣子知识库:其内容格式依据内容的呈现形态划分,包含文本、表格、图片。
- 文本:基于内容片段进行检索和召回。
- 表格:基于索引列的匹配(表格按行进行划分)进行检索和召回,同时也支持基于 NL2SQL 的查询和计算。
- 图片:基于标注信息的匹配进行检索和召回。
- 火山知识库:其内容格式依据数据的组织逻辑划分,包含结构化和非结构化。
- 结构化:文件内容为结构一致、字段明确的数据。
- 非结构化:文件内容丰富且版面复杂,如文章、报告、书籍等,通常结构不固定。
详细说明,请参考知识库类型。
扣子知识库和火山知识库的对比
扣子知识库和火山知识库在功能上无明显差异,均能满足知识数据的存储、召回等需求,但在使用场景和成本方面有所区别。扣子知识库提供一定的存储空间免费额度,适合初步体验知识库功能,帮助你快速上手。火山知识库从上传文档开始计费,虽然初期成本相对较高,但其在精细化内容管理、大规模数据存储以及高效检索方面表现更具优势,推荐在生产环境中使用火山知识库。
两者主要的区别如下:
|
对比维度
|
扣子知识库
|
火山知识库
|
|
产品定位
|
扣子编程官方知识库,支持智能切片管理,适合轻量检索场景。
|
火山引擎提供的企业级知识库服务,精细化切片管理,适合于企业客户场景。
|
|
存储空间与性能
|
轻量级数据量及检索操作。
|
相对扣子知识库,火山知识库支持更大的存储空间(例如单个知识库支持 300 万个文档数量)、更高的 QPS (单个知识库最高可支持 1 万 QPS)、更精细的切片管理(单个文档支持最大切片数 10 万个)和更复杂的文档处理需求,能够满足企业客户对于大规模知识库的存储需求。详细说明,请参考知识库配额说明。
|
|
操作难度
|
其操作流程简单便捷,用户可以轻松上手。
|
配置相对复杂、繁琐。
|
权限说明
工作空间成员默认可以创建、复制、查看知识库,空间所有者和管理员也可以禁止空间成员创建知识库。更多权限说明,请参考空间成员角色权限。
- 扣子知识库:扣子知识库暂不支持多人协作。只有知识库的所有者支持编辑、启用、删除自己创建的知识库,工作空间所有者、管理员以及普通成员都没有权限编辑、启用、删除其他成员创建的知识库。
- 火山知识库:仅允许关联空间所有者对应火山账号(包括主账号、子账号)中的火山知识库。
操作流程
使用知识库功能辅助大模型来生成回复内容时,需要完成以下操作。
- 创建/关联知识库
- 扣子知识库:创建知识库,并将需要的知识内容导入到知识库中。扣子编程支持导入文本内容和表格数据,并提供了多种导入方式,详情可参考创建文本知识库。
- 火山知识库:在火山引擎中创建知识库并导入知识内容后,再关联火山知识库到扣子编程。详情请参考关联火山知识库。
- 为低代码智能体或工作流绑定知识库
完成知识库创建和内容导入后,你可以在低代码智能体和工作流中添加知识库内容进行调用,详情可参考使用知识库。
- 配置检索和召回策略
在上传完知识内容后,可以通过相关配置来解决从哪里查、怎么查、用几条的问题。召回的内容的完整度和相关度越高,大模型生成的回复内容的准确性和可用性也就越高。
- 调试与优化
最后,你需要通过测试来不断优化回复的内容效果。
费用说明
扣子知识库和火山知识库的计费方式不同,详细说明如下:
|
类型
|
说明
|
|
扣子知识库
|
不同订阅套餐提供了不同容量的免费知识库存储空间。当免费知识库存储空间使用量达到上限时,个人免费版用户无法上传更多数据,扣子付费套餐支持自动扩容,对应用户可以继续上传,超出部分按量计费。详细说明,请参考知识库空间。
|
|
火山知识库
|
在扣子编程使用火山知识库时,知识库内容的存储、召回与重排操作均在火山知识库侧完成,然后由扣子大模型进行内容总结并返回给用户。因此存储、召回与重排会产生火山知识库费用,由火山方舟大模型服务平台收取,不支持通过扣子积分抵扣。火山知识库侧收取的费用如下,详情请参考知识库计费。
- 计算资源费用
- 离线存储资源费用
- 文本向量模型费用
- 重排模型费用
注意
- 创建火山知识库后上传文档,系统将自动分配和预留知识库所需的计算资源,并开始计费。
- 删除文档不会影响计算资源的占用,仍会继续计费。如果你不再需要使用火山知识库,请及时解绑并前往火山引擎控制台删除火山知识库以停止计费。
|