资源/知识库/知识库类型
知识库类型
更新于: 2026-06-24 15:44:40
扣子编程支持使用扣子知识库和火山知识库,两者对应的分类方式不同。
使用知识库功能的第一步就是上传知识内容。上传知识内容又分为两步,首先选择要上传的知识类型和上传方式,然后对上传的内容进行切分。合理的内容分片可以提升召回内容的相关性,从而提升大模型回复问题的准确性。
在上传知识前,建议先了解不同的知识类型的使用场景和导入方式,以便更好地管理知识内容。
|
对比项 |
文本类型 |
表格类型 |
照片知识库 |
|---|---|---|---|
|
使用场景 |
文本知识库支持基于内容片段进行检索和召回,大模型结合召回的内容生成最终内容回复,适用于知识问答等场景。 |
表格知识库支持基于索引列的匹配(表格按行进行划分),同时也支持基于 NL2SQL 的查询和计算。 |
照片知识库支持基于标注信息的匹配,适用于图像生成场景。 |
|
导入方式 |
|
|
本地图片:从本地文件中导入图片,支持 |
|
内容分段 |
支持自动内容分段和手动分段方式。 |
对于表格内容,默认按行分片,一行就是一个内容片段,不需要再进行分段设置。 |
不涉及。 |
|
索引 |
不涉及。 |
扣子编程支持设置索引字段。 |
扣子编程支持设置图片的标注信息。 |
扣子编程支持关联火山知识库。你需要先在火山引擎控制台中完成知识库创建,包括选择知识类型、导入方式、切片方式等配置,合理的内容分片可以提升召回内容的相关性,从而提升大模型回复问题的准确性。在使用火山知识库前,建议先了解不同的知识类型的使用场景和导入方式,以便更好地管理知识内容。详细信息,请参考创建知识库。
|
对比项 |
结构化数据 |
非结构化数据 |
|---|---|---|
|
使用场景 |
文件内容为结构一致、字段明确的数据,无需平台额外分段处理。例如问答数据(问题与答案)、用户数据(姓名、年龄、偏好等)、商品数据(名称、价格、库存)等。
|
文件内容丰富且版面复杂,如文章、报告、书籍等,通常结构不固定,需要平台进行解析和分段处理。
|
|
导入方式 |
|
|
|
切片方式 |
不涉及 |
支持如下切片规则:
|
|
索引 |
支持设置索引字段,并提供 HNSW-Hybrid、HNSW、FLAT 等索引算法供用户选择。 |
不涉及 |