助手
扣子 AI 帮助与支持
你好,我是 扣子 文档问答助手 🎉 你在阅读当前文档的过程中,无论对文档概念的解释,还是文档内容方面的疑问,都可以随时向我提问,我会全力为你解答
推荐问题
如何快速了解这个空间的核心内容?
有哪些近期更新的重点文档?
我应该从哪些文档开始阅读?
文档反馈

创建文本知识库

更新于: 2026-06-24 15:44:40

扣子知识库提供了高效便捷的方式来存储和管理外部数据(包括文本、表格及图片),使低代码智能体可以与指定数据进行交互,提升回复内容的准确性和可用性。本文介绍如何从本地文档、在线数据、飞书、微信公众号、Notion、自定义等渠道上传文本内容到知识库。

注意事项

  • 创建知识库前,请先阅读知识库概述使用限制了解其功能特性及使用限制。
  • 在目标知识库中首次上传文本时可以选择存储类型(平台预置存储系统、云搜索服务),后续不可变更。
  • 在扣子付费套餐中,知识库采用平台预置的存储系统或火山引擎云搜索服务,来存储知识库内容。扣子个人免费版套餐仅支持平台预置的存储系统。

存储类型

在扣子付费套餐中,知识库支持两种存储系统(平台预置的存储系统、火山引擎云搜索服务),对比说明如下表所示。

存储系统

说明

平台预置存储系统

无额外配置,操作便捷。

云搜索服务

云搜索服务是火山引擎提供的全托管一站式信息检索和分析平台,详情请参考云搜索服务。将知识库内容存储到火山引擎云搜索服务 OpenSearch 索引中,适用于已对接服务的用户搭建扣子编程智能体、基于云搜索服务搭建 RAG 推理服务、实现企业级数据隔离。
需要额外配置:

  • 当前扣子账号对应的火山账号需完成企业实名认证,详情请参考实名认证
  • 创建 OpenSearch 版本且开启公网访问的云搜索实例,详情请参考创建实例

操作流程

参考以下操作,上传文本内容到知识库。

  1. 登录扣子编程

  2. 在页面顶部选择目标工作空间,然后在左侧导航栏中单击资源库

  3. 在页面右上角,选择 +资源 > 知识库
    Image

  4. 在文本知识库中添加文本内容。

    1. 选择导入类型。
      Image
    2. 上传文本及设置文档解析、分段、存储、索引等策略。
      Image
      不同导入类型,对应的上传操作和策略配置不同,你可以参考如下文档完成配置。
  5. 等待服务器根据你所配置的各项策略对文档进行处理后,可查看上传的文本内容。

配置说明

扣子编程支持从本地文档、在线数据、飞书、微信公众号、Notion、自定义等渠道上传文本内容到知识库。不同导入类型,对应的配置有所不同,详细说明如下:

本地文档

扣子编程支持用户将本地文件中的文本内容导入到知识库,特定的配置说明如下:

操作

说明

上传配置

选择导入类型本地文档后,你可以在上传页面,单击上传或拖拽文档到上传区域。

文档解析策略配置

上传本地文档时,需在创建设置页面,配置文档解析策略,支持精准解析和快速解析:

  • 精准解析:支持从文档中提取图片元素、扫描件(OCR)、表格元素。对于 PDF 文件,还支持设置过滤策略,以文档页的粒度过滤掉当前文档中不需要导入的内容。精准解析通常耗时更久。
  • 快速解析:同样支持从文档中提取图像、表格等元素,但解析质量低于精准解析

分段策略配置

上传本地文档时,支持以自动分段与清洗、自定义分段和层级分段这三种方式对文本内容进行分段处理。
内容分段可以更有效地召回与用户查询最相关的内容,从而提升回复的准确性。合理的内容分段对回复的效果有着直接影响。如果分块太大,可能包含太多不相关的信息,从而降低了检索的准确性。相反,分块太小可能会丢失必要的上下文信息,导致生成的响应缺乏连贯性或深度。详细说明,请参考配置分段策略

配置存储

平台共享存储

使用扣子编程预置的默认存储系统,存储文本知识库内容。

云搜索服务

使用火山引擎云搜索服务,存储文本知识库内容。

注意

在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。

使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。

  • 地域:云搜索服务实例所在地域。
  • 实例名称:目标云搜索服务实例。
    使用云搜索服务所在的火山引擎账号登录扣子编程,此处会自动同步账号内指定地域下的云搜索服务实例。
  • 用户名:云搜索服务实例的用户名,固定为 admin。
  • 密码:云搜索服务实例的用户密码。

在线数据

扣子编程支持自动和手动方式采集在线网页中的文本内容,并上传到知识库,特定的配置说明如下:

操作

说明

上传配置

自动采集配置

选择导入类型在线数据后,你可以在新增URL页面,选择自动采集方式。自动采集方式支持单页面采集和多页面批量采集,相关参数配置如下:

  • 单页面采集
    • 添加方式:选择添加单个
    • 更新频率:选择内容更新频率。你可以设置在网页内容更新时,知识库内容是否自动更新及更新的频率。
    • 网址URL:输入待采集内容的网址。网址存在以下限制:
      • 不支持从百度及其相关网址中上传内容。
      • 不支持从你的内部网址上传内容。
  • 多页面批量采集
    • 添加方式:选择批量添加
    • 根地址或网站地图:输入待批量添加的网页的根地址或网站地图中的地址。网址存在以下限制:
      • 不支持从百度及其相关网址中上传内容。
      • 不支持从你的内部网址上传内容。

手动采集配置

选择导入类型在线数据后,你可以在新增URL页面,选择手动采集方式。即你可以在浏览器中安装扩展程序并标注采集范围,进行在线数据手动采集。手动采集方式的成功率较高。
手动采集时,支持在网页中标注采集的范围。具体操作,请参考使用扣子 scraper 采集数据

说明

首次在某个浏览器中进行手动采集时,需先安装 Coze Scraper 扩展程序并根据页面提示为 Coze Scraper 授权。安装步骤,请参考安装 Scraper

分段策略配置

上传在线数据时,支持以自动分段与清洗、自定义分段这两种方式对文本内容进行分段处理。
内容分段可以更有效地召回与用户查询最相关的内容,从而提升回复的准确性。合理的内容分段对回复的效果有着直接影响。如果分块太大,可能包含太多不相关的信息,从而降低了检索的准确性。如果分块太小,可能会丢失必要的上下文信息,导致生成的响应缺乏连贯性或深度。详细说明,请参考配置分段策略

配置存储

平台共享存储

使用扣子编程预置的默认存储系统,存储文本知识库内容。

云搜索服务

使用火山引擎云搜索服务,存储文本知识库内容。

注意

在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。

使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。

  • 地域:云搜索服务实例所在地域。
  • 实例名称:目标云搜索服务实例。
    你需要使用云搜索服务所在的火山引擎账号登录扣子编程,此处会自动同步账号内指定地域下的云搜索服务实例。
  • 用户名:云搜索服务实例的用户名,固定为 admin。
  • 密码:云搜索服务实例的用户密码。

飞书文档

扣子编程支持用户将授权过的飞书文档上传到知识库,特定的配置说明如下:

操作

说明

设置上传配置

选择导入类型飞书后,你可以在选择文件页面,选择目标文档,上传到知识库。
首次导入某个飞书账号的文档时,需要先根据页面提示完成授权和安装。支持绑定多个飞书账号。具体操作,请参考管理数据源权限

说明

  • 支持导入我的空间下所有者为本人的云文档以及知识库Wiki中的文档,暂不支持导入共享空间下的云文档。
  • 创建飞书知识库时,由于飞书官方限制,在知识库Wiki页签下筛选文档时,如果筛选结果超过 200 条,只展示前 200 条。

选择文件页面,你还可以设置飞书账号级别的更新频率,以控制知识库内飞书文档的同步更新行为。

设置分段策略配置

上传飞书文档时,支持以自动分段与清洗、自定义分段这两种方式对文本内容进行分段处理。
内容分段可以更有效地召回与用户查询最相关的内容,从而提升回复的准确性。合理的内容分段对回复的效果有着直接影响。如果分块太大,可能包含太多不相关的信息,从而降低了检索的准确性。如果分块太小,可能会丢失必要的上下文信息,导致生成的响应缺乏连贯性或深度。详细说明,请参考配置分段策略

配置存储

平台共享存储

使用扣子编程预置的默认存储系统,存储文本知识库内容。

云搜索服务

使用火山引擎云搜索服务,存储文本知识库内容。

注意

在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。

使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。

  • 地域:云搜索服务实例所在地域。
  • 实例名称:目标云搜索服务实例。
    你需要使用云搜索服务所在的火山引擎账号登录扣子编程,此处会自动同步账号内指定地域下的云搜索服务实例。
  • 用户名:云搜索服务实例的用户名,固定为 admin。
  • 密码:云搜索服务实例的用户密码。

微信公众号

微信公众号沉淀了海量的优质内容,涵盖了各行各业的知识、观点和资讯,将公众号文档作为知识库,能够提升智能体在垂直领域的专业度。以 KOL (Key Opinion Leader)类用户为例,他们的公众号积累了大量的原创内容。通过将扣子编程的智能体嵌入到公众号作为智能回复机器人,并将公众号内容作为智能体的知识库,当用户向智能体提问时,智能体能够快速检索并整合公众号中的相关信息,提供精准、专业的回复。
扣子编程支持用户将公众号文档上传到知识库,特定的配置说明如下:

操作

说明

设置上传配置

选择导入类型公众号后,你可以在选择文件页面,选择目标文档,上传到知识库。
首次导入某个公众号的文档时,需要先根据页面提示完成授权。支持绑定多个公众号账号。具体操作,请参考管理数据源权限

说明

每次最多导入 20 篇公众号文档,不支持导入视频文档。

选择文件页面,你还可以设置公众号账号级别的更新频率,以控制知识库内公众号文档列表的同步更新行为。

分段策略配置

上传公众号文档时,支持以自动分段与清洗、自定义分段这两种方式对文本内容进行分段处理。
内容分段可以更有效地召回与用户查询最相关的内容,从而提升回复的准确性。合理的内容分段对回复的效果有着直接影响。如果分块太大,可能包含太多不相关的信息,从而降低了检索的准确性。如果分块太小,可能会丢失必要的上下文信息,导致生成的响应缺乏连贯性或深度。详细说明,请参考配置分段策略

配置存储

平台共享存储

使用扣子编程预置的默认存储系统,存储文本知识库内容。

云搜索服务

使用火山引擎云搜索服务,存储文本知识库内容。

注意

在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。

使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。

  • 地域:云搜索服务实例所在地域。
  • 实例名称:目标云搜索服务实例。
    你需要使用云搜索服务所在的火山引擎账号登录扣子编程,此处会自动同步账号内指定地域下的云搜索服务实例。
  • 用户名:云搜索服务实例的用户名,固定为 admin。
  • 密码:云搜索服务实例的用户密码。

Notion

扣子编程支持用户从 Notion 中导入文本到知识库,特定的配置说明如下:

操作

说明

设置上传配置

选择导入类型Notion 后,你可以在选择文件页面,选择要导入的 Notion 文档。
首次导入某个账号下的 Notion 数据时,需要先根据页面提示完成授权。支持绑定多个 Notion 账号。具体操作,请参考管理数据源权限

设置分段策略配置

上传 Notion **** 数据时,支持以自动分段、自定义分段这两种方式对文本内容进行分段处理。
内容分段可以更有效地召回与用户查询最相关的内容,从而提升回复的准确性。合理的内容分段对回复的效果有着直接影响。如果分块太大,可能包含太多不相关的信息,从而降低了检索的准确性。如果分块太小,可能会丢失必要的上下文信息,导致生成的响应缺乏连贯性或深度。详细说明,请参考配置分段策略

配置存储

平台共享存储

使用扣子编程预置的默认存储系统,存储文本知识库内容。

云搜索服务

使用火山引擎云搜索服务,存储文本知识库内容。

注意

在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。

使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。

  • 地域:云搜索服务实例所在地域。
  • 实例名称:目标云搜索服务实例。
    你需要使用云搜索服务所在的火山引擎账号登录扣子编程,此处会自动同步账号内指定地域下的云搜索服务实例。
  • 用户名:云搜索服务实例的用户名,固定为 admin。
  • 密码:云搜索服务实例的用户密码。

自定义

扣子编程支持用户添加自定义的文本内容到知识库,特定的配置说明如下:

操作

说明

设置上传配置

选择导入类型自定义后,你可以在文本填写页面,输入文档名称和内容来添加待导入的文本内容。上传自定义文本内容时,支持插入图片。

设置分段策略配置

上传自定义文本时,支持以自动分段、自定义分段这两种方式对文本内容进行分段处理。
内容分段可以更有效地召回与用户查询最相关的内容,从而提升回复的准确性。合理的内容分段对回复的效果有着直接影响。如果分块太大,可能包含太多不相关的信息,从而降低了检索的准确性。如果分块太小,可能会丢失必要的上下文信息,导致生成的响应缺乏连贯性或深度。详细说明,请参考配置分段策略

配置存储

平台共享存储

使用扣子编程预置的默认存储系统,存储文本知识库内容。

云搜索服务

使用火山引擎云搜索服务,存储文本知识库内容。

注意

在知识库中选定云搜索服务进行存储后,如果在云搜索服务侧修改了实例的用户密码,请及时更新知识库侧的密码配置。

使用云搜索服务时,需完成如下配置,并单击测试,测试扣子编程与云搜索服务已连通。

  • 地域:云搜索服务实例所在地域。
  • 实例名称:目标云搜索服务实例。
    你需要使用云搜索服务所在的火山引擎账号登录扣子编程,此处会自动同步账号内指定地域下的云搜索服务实例。
  • 用户名:云搜索服务实例的用户名,固定为 admin。
  • 密码:云搜索服务实例的用户密码。

相关操作

创建知识库后,你可以在智能体或工作流中使用知识库。同时,你还可以依据业务发展的实际需求,对知识库进行更新、删除、更新数据源权限等操作。相关操作说明如下:

  • 使用知识库:在智能体或工作流中添加知识库,丰富 AI 应用的知识范围,提高模型回复内容的可靠性。
  • 维护知识库:根据业务变化,你可以对知识库进行停用、启用、编辑、删除等操作。
  • 管理数据源权限:从飞书、微信公众号、Notion等渠道上传文本时,需要获取数据源侧的授权。完成授权后,你可以随时移除授权或添加其他账号的授权。