扣子知识库提供了高效便捷的方式来存储和管理外部数据(包括文本、表格及图片),使低代码智能体可以与指定数据进行交互,提升回复内容的准确性和可用性。本文介绍如何从本地文档、在线数据、飞书、微信公众号、Notion、自定义等渠道上传文本内容到知识库。
在扣子付费套餐中,知识库支持两种存储系统(平台预置的存储系统、火山引擎云搜索服务),对比说明如下表所示。
|
存储系统 |
说明 |
|---|---|
|
平台预置存储系统 |
无额外配置,操作便捷。 |
|
云搜索服务 |
云搜索服务是火山引擎提供的全托管一站式信息检索和分析平台,详情请参考云搜索服务。将知识库内容存储到火山引擎云搜索服务 OpenSearch 索引中,适用于已对接服务的用户搭建扣子编程智能体、基于云搜索服务搭建 RAG 推理服务、实现企业级数据隔离。 |
参考以下操作,上传文本内容到知识库。
登录扣子编程。
在页面顶部选择目标工作空间,然后在左侧导航栏中单击资源库。
在页面右上角,选择 +资源 > 知识库。
在文本知识库中添加文本内容。
等待服务器根据你所配置的各项策略对文档进行处理后,可查看上传的文本内容。
扣子编程支持从本地文档、在线数据、飞书、微信公众号、Notion、自定义等渠道上传文本内容到知识库。不同导入类型,对应的配置有所不同,详细说明如下:
扣子编程支持用户将本地文件中的文本内容导入到知识库,特定的配置说明如下:
|
操作 |
说明 |
|
|---|---|---|
|
上传配置 |
选择导入类型为本地文档后,你可以在上传页面,单击上传或拖拽文档到上传区域。 |
|
|
文档解析策略配置 |
上传本地文档时,需在创建设置页面,配置文档解析策略,支持精准解析和快速解析:
|
|
|
分段策略配置 |
上传本地文档时,支持以自动分段与清洗、自定义分段和层级分段这三种方式对文本内容进行分段处理。 |
|
|
配置存储 |
平台共享存储 |
使用扣子编程预置的默认存储系统,存储文本知识库内容。 |
|
云搜索服务 |
使用火山引擎云搜索服务,存储文本知识库内容。 注意 在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。 使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。
|
|
扣子编程支持自动和手动方式采集在线网页中的文本内容,并上传到知识库,特定的配置说明如下:
|
操作 |
说明 |
|
|---|---|---|
|
上传配置 |
自动采集配置 |
选择导入类型为在线数据后,你可以在新增URL页面,选择自动采集方式。自动采集方式支持单页面采集和多页面批量采集,相关参数配置如下:
|
|
手动采集配置 |
选择导入类型为在线数据后,你可以在新增URL页面,选择手动采集方式。即你可以在浏览器中安装扩展程序并标注采集范围,进行在线数据手动采集。手动采集方式的成功率较高。 说明 首次在某个浏览器中进行手动采集时,需先安装 Coze Scraper 扩展程序并根据页面提示为 Coze Scraper 授权。安装步骤,请参考安装 Scraper。 |
|
|
分段策略配置 |
上传在线数据时,支持以自动分段与清洗、自定义分段这两种方式对文本内容进行分段处理。 |
|
|
配置存储 |
平台共享存储 |
使用扣子编程预置的默认存储系统,存储文本知识库内容。 |
|
云搜索服务 |
使用火山引擎云搜索服务,存储文本知识库内容。 注意 在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。 使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。
|
|
扣子编程支持用户将授权过的飞书文档上传到知识库,特定的配置说明如下:
|
操作 |
说明 |
|
|---|---|---|
|
设置上传配置 |
选择导入类型为飞书后,你可以在选择文件页面,选择目标文档,上传到知识库。 说明
在选择文件页面,你还可以设置飞书账号级别的更新频率,以控制知识库内飞书文档的同步更新行为。 |
|
|
设置分段策略配置 |
上传飞书文档时,支持以自动分段与清洗、自定义分段这两种方式对文本内容进行分段处理。 |
|
|
配置存储 |
平台共享存储 |
使用扣子编程预置的默认存储系统,存储文本知识库内容。 |
|
云搜索服务 |
使用火山引擎云搜索服务,存储文本知识库内容。 注意 在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。 使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。
|
|
微信公众号沉淀了海量的优质内容,涵盖了各行各业的知识、观点和资讯,将公众号文档作为知识库,能够提升智能体在垂直领域的专业度。以 KOL (Key Opinion Leader)类用户为例,他们的公众号积累了大量的原创内容。通过将扣子编程的智能体嵌入到公众号作为智能回复机器人,并将公众号内容作为智能体的知识库,当用户向智能体提问时,智能体能够快速检索并整合公众号中的相关信息,提供精准、专业的回复。
扣子编程支持用户将公众号文档上传到知识库,特定的配置说明如下:
|
操作 |
说明 |
|
|---|---|---|
|
设置上传配置 |
选择导入类型为公众号后,你可以在选择文件页面,选择目标文档,上传到知识库。 说明 每次最多导入 20 篇公众号文档,不支持导入视频文档。 在选择文件页面,你还可以设置公众号账号级别的更新频率,以控制知识库内公众号文档列表的同步更新行为。 |
|
|
分段策略配置 |
上传公众号文档时,支持以自动分段与清洗、自定义分段这两种方式对文本内容进行分段处理。 |
|
|
配置存储 |
平台共享存储 |
使用扣子编程预置的默认存储系统,存储文本知识库内容。 |
|
云搜索服务 |
使用火山引擎云搜索服务,存储文本知识库内容。 注意 在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。 使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。
|
|
扣子编程支持用户从 Notion 中导入文本到知识库,特定的配置说明如下:
|
操作 |
说明 |
|
|---|---|---|
|
设置上传配置 |
选择导入类型为 Notion 后,你可以在选择文件页面,选择要导入的 Notion 文档。 |
|
|
设置分段策略配置 |
上传 Notion **** 数据时,支持以自动分段、自定义分段这两种方式对文本内容进行分段处理。 |
|
|
配置存储 |
平台共享存储 |
使用扣子编程预置的默认存储系统,存储文本知识库内容。 |
|
云搜索服务 |
使用火山引擎云搜索服务,存储文本知识库内容。 注意 在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。 使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。
|
|
扣子编程支持用户添加自定义的文本内容到知识库,特定的配置说明如下:
|
操作 |
说明 |
|
|---|---|---|
|
设置上传配置 |
选择导入类型为自定义后,你可以在文本填写页面,输入文档名称和内容来添加待导入的文本内容。上传自定义文本内容时,支持插入图片。 |
|
|
设置分段策略配置 |
上传自定义文本时,支持以自动分段、自定义分段这两种方式对文本内容进行分段处理。 |
|
|
配置存储 |
平台共享存储 |
使用扣子编程预置的默认存储系统,存储文本知识库内容。 |
|
云搜索服务 |
使用火山引擎云搜索服务,存储文本知识库内容。 注意 在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。 使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。
|
|
创建知识库后,你可以在智能体或工作流中使用知识库。同时,你还可以依据业务发展的实际需求,对知识库进行更新、删除、更新数据源权限等操作。相关操作说明如下: