本文以金融知识库为例,介绍如何基于大模型核心能力,通过企业知识引擎构建智能检索工具,实现知识导入与智能应答功能。
登录营销 Agent 控制台,在左侧导航栏选择企业知识引擎。
在企业知识引擎左侧导航栏,选择知识管理 > 知识库。
新增知识库。填写基础配置信息,完成后单击保存,完成新的知识库的创建。
具体参数配置说明如下表格:
参数 | 参数说明 | 示例 |
|---|---|---|
名称 | 知识库名称 | XX银行智能助手知识库演示 |
描述 | 简要描述企业知识引擎的用途或包含的内容(限制200字以内) | XX银行智能助手 |
内容类型 | 选择知识库类型,目前支持以下五种类型:
| 通用内容 |
点击新建好的知识库,进入知识库详情页面。在知识管理页面单击导入知识。
选择通用文档导入方式。
设置文件保存路径,并上传文件作为知识库内容。然后单击下一步。
上传的文件可包括:支行网点信息、理财风险揭示书和产品说明书、理财协议文件、产品销售文件、产品附加说明。
配置知识分段方式,选择自动分段方式、其他配置保持默认项,然后单击完成。
具体参数详情请参见导入知识。
导入成功后,所有文件内容会自动分段,待解析完成后在知识管理页面查看。
点击知识名称,可进入知识详情页查看分段详情。
在企业知识引擎左侧导航栏选择检索应用,并新建应用。
自定义设置检索应用的名称与描述,并单击保存。
例如:
在应用编排页面左侧,设置检索参数。
参数 | 参数说明与示例值 |
|---|---|
基础信息 |
|
引用知识 | 添加知识库,选择上一步创建的银行知识库。 |
向量检索权重 | 调节关键词匹配与语义理解的比重:值越低越注重精确词句命中,值越高越注重整体语义相关性。 |
混合相似度阈值 | 综合语义匹配和关键词匹配的相关性得分下限。仅当候选文档的混合相似度 ≥ 该阈值时才会被召回。数值越高,召回结果越精准但数量越少;数值越低,召回范围越广但可能引入噪声。 |
排序策略 |
示例值:语义模型排序 |
初筛分片数 | 从知识库中检索并返回的候选分片数量。数值越大,召回的信息覆盖面越广,但会增加处理时间。该数值应 ≥ 精选分片数。 |
排序分数阈值 | 当设置阈值后,仅保留分数 ≥ 该阈值的召回分片,低于阈值的结果将被直接过滤,不参与最终展示。阈值越高结果越精确,但召回数量可能减少;阈值越低结果越丰富,但可能混入相关性较弱内容。 |
召回分段数 | 经过重排序后,最终在检索列表展示和送入大模型的分片数量。数值越大,模型获得的参考信息越多,但可能引入噪声。 |
开启智能检索 | 开启后,系统将通过大模型对召回关键词进行语义改写,以提升检索效果。返回结果中,第一条为大模型基于召回内容生成的总结摘要,其余为匹配到的相关文档分段。注意:开启该功能后,检索耗时将有所增加。 |
在应用编排页面右侧,输入关键词调试应用,验收应用效果,并基于效果重新调整参数配置。
完成所有配置后,在页面右上角单击发布。
调用检索应用。在企业知识引擎控制台左侧导航栏,进入开放平台 > 开放能力页面,参考平台提供的 OpenAPI 接入流程、检索应用调用 API,将检索应用接入到您的业务系统中。API 文档说明请参见检索应用调用。
以三方平台(如 Postman)为例,调用检索应用调用 API 获取检索结果的示例如下图所示。