跳到主要内容

知识库写入节点

知识库写入节点用于将流程中产生的文本内容写入到指定知识库,从而实现知识库数据的动态更新与扩充。该节点是构建自动化知识积累、数据采集入库等场景的核心组件。

一、应用场景

  • 自动采集入库:将 HTTP 节点抓取的外部数据经 LLM 整理后,自动写入知识库,构建持续更新的知识体系。
  • 对话摘要沉淀:在客服/咨询场景中,将对话结束后的对话摘要写入知识库,供后续查询复用。
  • 文档自动归档:将用户上传的文本、表单正文等结构化内容自动写入知识库,实现文档集中管理。
  • 数据清洗入库:结合代码节点或 LLM 节点对原始数据进行清洗、格式化后,再写入知识库。
  • 知识库动态扩充:基于用户反馈或业务变化,通过流程自动向知识库追加新内容,保持知识库的时效性。

二、添加知识库写入节点

在画布中点击前一节点右侧的 ,选择知识库写入节点完成添加。

三、节点配置详解

选中添加的知识库写入节点,即可打开配置面板进行详细配置。

1. 输入变量

输入变量用于将前置节点的输出数据传递到当前节点,作为写入内容中的动态占位符来源。

  • 左侧输入框:填写变量名称(如 contentsummary),用于在写入内容中通过 {{变量名}} 引用。
  • 右侧下拉框:选择变量来源,仅可选择当前节点之前的节点输出变量。
  • 类型限制:仅支持 stringnumber 类型的变量。

变量必须来自当前节点之前的节点(通过连线连接),不可引用并行或后续节点的变量。


2. 选择知识库

点击添加按钮,在弹出的知识库选择面板中选择目标知识库。

仅支持选择 1 个知识库,如果选择了多个知识库,系统会自动保留第一个。

选中的知识库会以卡片形式展示在配置面板中,鼠标悬停可显示删除按钮,点击即可移除。


3. 写入内容

在文本编辑区域中填写需要写入知识库的内容。支持纯文本输入,也支持通过 {{变量名}} 引用输入变量,实现动态内容拼接。

  • 输入 / 可快速插入前置节点的变量。
  • 占位符格式为 {{变量名}},运行时自动替换为输入变量的实际值。
  • 写入内容不能为空,否则节点校验不通过。

示例:

以下是用户咨询的问题摘要:
问题:{{question}}
回答:{{answer}}
记录时间:{{timestamp}}

4. 分段策略

分段策略决定了写入内容如何切分成多个文档片段进行向量化存储。提供两种模式:

① 自动分段与清洗(默认)

系统自动根据文本内容智能切分与清洗,无需手动配置,适合大多数场景。

② 自定义分段

选择"自定义"后,可精细控制分段行为:

配置项说明
分段标识符用于拆分文本的分隔符,支持:换行、2个换行、中文句号/叹号/问号、英文句号/叹号/问号、自定义
自定义分段标识符当分段标识符选择"自定义"时填写,可输入任意字符串作为分隔符
分段最大长度每个文档片段的最大字符数,范围 100~5000,默认 800
分段重叠度%相邻片段之间的重叠比例,范围 0~90,默认 10。适度重叠可保证语义连贯性
文本预处理规则可选,支持以下预处理操作:

文本预处理规则选项:

  • 替换掉连续的空格、换行符和制表符:清理文本中多余的空白字符
  • 删除所有 URL 和电子邮箱地址:去除文本中的链接和邮箱信息

5. 输出变量

知识库写入节点执行成功后,输出以下变量:

变量名类型说明
documentIdstring写入知识库后生成的文档 ID,可供后续节点引用

下游节点可通过引用 documentId 变量来获取写入结果,用于日志记录、条件判断等场景。


四、配置示例

以下是一个典型的"对话摘要写入知识库"配置示例:

  1. 输入变量:配置变量 summary,来源为上游 LLM 节点的输出 result
  2. 选择知识库:选择"客服对话摘要库"。
  3. 写入内容
{{summary}}
  1. 分段策略:选择"自动分段与清洗"。
  2. 预期输出:节点执行后,documentId 将返回新写入文档的唯一标识。

五、注意事项

使用知识库写入节点前,请确保已在系统中创建好目标知识库,否则将无法选择知识库。

写入的文档标题由系统自动生成(格式为"节点名称-时间戳"),无需手动指定。

  • 每次节点执行会向知识库新增一个文档,适合增量写入场景。
  • 写入内容中的 {{变量名}} 占位符,若对应变量值为空,则替换为空字符串。
  • 自定义分段策略中的参数配置,直接影响后续知识库检索的精度和召回率,建议根据实际内容特点进行调优。