助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

知识库类型

更新于: 2026-06-24 15:44:40

扣子编程支持使用扣子知识库和火山知识库,两者对应的分类方式不同。

扣子知识库

使用知识库功能的第一步就是上传知识内容。上传知识内容又分为两步,首先选择要上传的知识类型和上传方式,然后对上传的内容进行切分。合理的内容分片可以提升召回内容的相关性,从而提升大模型回复问题的准确性。
在上传知识前,建议先了解不同的知识类型的使用场景和导入方式,以便更好地管理知识内容。

对比项

文本类型

表格类型

照片知识库

使用场景

文本知识库支持基于内容片段进行检索和召回,大模型结合召回的内容生成最终内容回复,适用于知识问答等场景。

表格知识库支持基于索引列的匹配(表格按行进行划分),同时也支持基于 NL2SQL 的查询和计算。

照片知识库支持基于标注信息的匹配,适用于图像生成场景。

导入方式

  • 本地文档:从本地文件中导入文本内容,支持.txt.pdfdoc.docx 文件格式。
  • 在线数据:通过自动和手动方式采集指定网页的内容。
  • 第三方渠道:从飞书文档和 Notion 文档中导入内容。
  • 自定义:手动输入要导入的文本内容。
  • 本地文档:从本地文件中导入表格内容,支持.csv.xlsx文件格式。
  • 在线数据:通过 API 导入数据。
  • 第三方渠道:支持从飞书表格中导入数据。
  • 自定义:手动输入要导入的表格数据。

本地图片:从本地文件中导入图片,支持JPGJPEGPNG图片格式。

内容分段

支持自动内容分段和手动分段方式。

对于表格内容,默认按行分片,一行就是一个内容片段,不需要再进行分段设置。

不涉及。

索引

不涉及。

扣子编程支持设置索引字段。
用户输入的问题会与设置的索引字段内容对比,根据相似度匹配最相关的内容给大模型用于内容生成。

扣子编程支持设置图片的标注信息。
用户输入的问题会与设置的标注信息对比,根据相似度匹配最相关的图片给大模型用于内容生成。

火山知识库

扣子编程支持关联火山知识库。你需要先在火山引擎控制台中完成知识库创建,包括选择知识类型、导入方式、切片方式等配置,合理的内容分片可以提升召回内容的相关性,从而提升大模型回复问题的准确性。在使用火山知识库前,建议先了解不同的知识类型的使用场景和导入方式,以便更好地管理知识内容。详细信息,请参考创建知识库

对比项

结构化数据

非结构化数据

使用场景

文件内容为结构一致、字段明确的数据,无需平台额外分段处理。例如问答数据(问题与答案)、用户数据(姓名、年龄、偏好等)、商品数据(名称、价格、库存)等。

  • 问答总结:在 Excel 文档中定义问题列和答案列,上传至知识库后,指定问题列用于知识库检索,答案列用于大模型回答参考。
  • 商品数据整理:适用于电商平台商品信息管理,包括商品名称、描述、价格、库存等字段,方便商品搜索、分类、推荐。

文件内容丰富且版面复杂,如文章、报告、书籍等,通常结构不固定,需要平台进行解析和分段处理。

  • 知识文档管理:存储和管理知识文档,通过知识库解析分段转化为可检索、可引用的知识资源,便于查阅和学习。

导入方式

  • 本地上传
  • 从 TOS 中导入
  • 公开下载链接
  • 本地上传
  • 从 TOS 中导入
  • 公开下载链接

切片方式

不涉及

支持如下切片规则:

  • 默认切片规则:系统会自动保留完整语义进行切片。
  • 自定义切片规则:通过指定切片最大长度图片 OCR合并短文本片等参数定义切片规则。

索引

支持设置索引字段,并提供 HNSW-Hybrid、HNSW、FLAT 等索引算法供用户选择。

不涉及