可通过将定制词法字典与企业搜索集合集成来改进搜索结果的质量和精确度。
IBM® Content Analytics with Enterprise Search 提供内置字典以对内容进行解析和标记化。可创建定制字典以确保准备索引内容时,解析器使用特定于您的企业的词汇表和语法构造。因为内容分析集合支持定制用户字典,所以可仅对企业搜索集合配置词法字典。
在某些情况下,在字典中注册为某种语言的单词对使用其他语言的文档不起作用。例如,注册为英语的单词对使用日语编写的文档不起作用。在其他情况下,已注册单词可能对搜索不起作用,因为对系统定义的规则的优先级高于特定于集合的字典。
要创建定制词法字典,域或主题专家必须定义您要用于解析 XML 文件中的内容的特定于企业的术语。接着,他们使用 ES_INSTALL_ROOT/bin/eslexdictbuilder 工具来创建字典文件(.dic 文件)。
要使用定制字典,必须将该字典上载至系统并将该字典与一个或多个集合相关联。
将字典上载至系统后,不能使用管理控制台来修改该字典。要修改该字典,必须更新 XML 文件,重建该字典,然后将新字典上载至系统。