You need to enable JavaScript to run this app.
文档中心
Viking AI 搜索

Viking AI 搜索

复制全文
下载 pdf
用户指南
自定义搜索词库
复制全文
下载 pdf
自定义搜索词库

说明

说明
Viking AI 搜索是火山引擎推出的一站式 AI 搜索/推荐/问答 SaaS 服务。本文主要介绍自定义搜索词库功能,您可以导入候选词库提升猜你想搜和搜索补全的覆盖度,批量导入同义词组提高搜索召回能力,以及上传搜索纠错保护词表避免特定词条被误纠。

自定义词库功能包含以下模块:

  • 猜你想搜/搜索补全候选词库:为猜你想搜和搜索补全功能导入自定义的搜索建议词条,支持按搜索频次排序。注意:自定义的候选词库为系统自动生成词库的增量补充。导入人工词库后,系统会将其与自动生成的词库进行融合排序,而非替换原有词库
  • 同义词库:批量导入双向或单向同义词组,扩大搜索召回范围
  • 保护词库:为搜索纠错功能导入保护词表,命中保护词的搜索词将跳过纠错模型

搜索词库管理

所有类型的自定义词库统一在 搜索词库 **** 页面进行创建、查看、关联应用、删除等操作。词库独立于应用和搜索策略,通过关联的形式加载到对应的功能场景中。

搜索词库页面

进入控制台后,在左侧导航栏找到 搜索词库 入口,即可查看所有已上传的词库列表。页面支持按词库类型(猜你想搜词库、搜索补全词库、同义词库、搜索纠错保护词库)进行筛选和查询。
每个词库会展示以下信息:词库名称、词条数量、关联策略数、创建人、最后更新时间等。

创建词库

  1. 在词库管理页面,点击**「添加词库」**。
  2. 选择词库类型:猜你想搜/搜索补全候选词库、同义词库(双向 / 单向)、保护词库:
    1. 猜你想搜/搜索补全候选词库:支持导入自定义的候选词库,解决猜你想搜/搜索补全场景冷启动效果不佳、词库覆盖不全等问题。导入后的人工词库将与系统自动生成的词库融合排序;
    2. 双向同义词库:同组词互相扩展召回。例如 A = B = C,搜索任意一个词都能召回其他词对应的结果;
    3. 单向同义词库:仅触发词扩展到扩展词。例如 A → B, C,搜索 A 时能召回 B 和 C 的结果,但搜索 B 或 C 时不会召回 A 的结果;
    4. 保护词库:开启搜索纠错功能后,系统会自动对用户输入的搜索词进行拼写纠错。但在某些场景下,部分专有名词、品牌名、产品型号等可能被误纠。通过上传保护词表,您可以指定特定词条跳过纠错模型,避免误纠;
  3. 根据所选类型,下载对应的 CSV 模板文件,填写词库数据。
  1. 上传填写完成的 CSV 文件。系统将自动校验数据格式,校验通过后词库创建成功。

说明

说明
每个词库支持最多 50,000 条词条。
每类型词库最多上传 5 个。

  1. (非必选)选择当前词库需要关联的应用 - 搜索策略,即可在该关联策略下生效当前词库。

删除词库

在词库列表中找到要删除的词库卡片,点击右上角,即可删除词库。

说明

说明
为了线上服务安全起见,已关联搜索策略的词库,不允许直接删除,需要先到对应搜索策略页面解绑后再执行删除操作。

自定义猜你想搜/搜索补全候选词库

猜你想搜和搜索补全功能支持导入自定义的候选词库,解决冷启动效果不佳、词库覆盖不全等问题。导入后的人工词库将与系统自动生成的词库融合排序。

候选词库 CSV 格式

候选词库的 CSV 文件包含以下字段:

字段

是否必填

说明

候选词

词条内容

搜索频次

初始搜索频次,用于词条在搜索建议中的排序,必须为正整数,如未填默认为0。

搜索频次处理规则

上传候选词库时,系统会根据是否填写了搜索频次字段,采用不同的处理逻辑:

  • 已填写搜索频次:系统仅做数值类型校验,直接使用上传的数值。搜索频次越高,词条在搜索建议中的排序越靠前。
  • 未填写搜索频次:默认为 0 。

关联候选词库

进入应用后,在体验配置 > 搜索 > 搜索词配置页面,找到猜你想搜或搜索补全模块,点击**「关联词库」,选择已创建的候选词库即可完成关联。
关联完成后,可在体验区域实时预览搜索建议效果。验证完成后点击
「更新配置」**,使配置生效。

取消关联词库

鼠标悬浮至已关联的词库上,出现删除按钮。点击后进行二次确认,确认后取消该词库的关联。取消关联不会删除词库本身,您可以随时重新关联。

自定义同义词组

AI 搜索支持通过批量导入或手动添加的方式管理同义词组,以扩大搜索召回范围。支持两种同义词类型:

  • 双向同义词:同组词互相扩展召回。例如 A = B = C,搜索任意一个词都能召回其他词对应的结果。
  • 单向同义词:仅触发词扩展到扩展词。例如 A → B, C,搜索 A 时能召回 B 和 C 的结果,但搜索 B 或 C 时不会召回 A 的结果。

关联同义词库

进入应用后,在体验配置 > 搜索词配置 > 搜索词典 > 同义词模块,点击**「关联词库」,​选择已创建的同义词库即可完成关联。
关联完成后,可在体验区域实时预览搜索建议效果。验证完成后点击
「更新配置」**,使配置生效。

存量同义词兼容

如果您的应用中已有通过手动逐条添加的同义词数据,词库功能上线前已在词库管理页面中为您自动生成对应的词库(名称默认为「未命名词库」),您可以在词库管理页面对其进行重命名和管理。

自定义搜索纠错保护词库

当开启搜索纠错功能后,系统会自动对用户输入的搜索词进行拼写纠错。但在某些场景下,部分专有名词、品牌名、产品型号等可能被误纠。通过上传保护词表,您可以指定特定词条跳过纠错模型,避免误纠。

保护词库 CSV 格式

保护词库的 CSV 文件仅包含一个字段:

字段

是否必填

说明

保护词

需要保护的词条,当搜索词命中该词条时,将跳过纠错模型

上传保护词表

进入应用后,在体验配置 > 搜索词配置 > 搜索引导 > 搜索词纠错模块,点击**「关联词库」,选择已创建的保护词库即可完成关联。
关联完成后,可在体验区域实时预览搜索建议效果。验证完成后点击
「更新配置」**,使配置生效。

配置匹配模式

关联词库时,需要选择匹配模式,用于定义搜索词与保护词的匹配规则:

匹配模式

说明

示例

完全匹配
(默认值)

搜索词与保护词完全一致时生效

保护词为"Apple",搜索"Apple"时跳过纠错,搜索"Apple 手机"时不跳过

包含

搜索词中包含保护词即可生效

保护词为"Apple",搜索"Apple"和"Apple 手机"时均跳过纠错

说明

说明

  • 保护词表仅影响搜索纠错环节,不会影响搜索召回和排序的其他策略。
最近更新时间:2026.06.15 13:06:34
这个页面对您有帮助吗?
有用
有用
无用
无用