IBM® Informix® 12.10

Snowball 分析器

Snowball 分析器将词语转换为特定于语言和代码集的主干词。

Snowball 分析器与标准分析器相似,只是 Snowball 分析器将词语转换为主干词。

Snowball 分析器通过以下方式处理文本字符:

缺省情况下,Snowball 分析器使用 DB_LOCALE 环境变量指定的语言和代码集。通过在 CREATE INDEX 语句中将语言名称或同义词附加到 Snowball 分析器名称后面,可以为 Snowball 分析器指定其他语言:snowball.language

Snowball 分析器支持属于 8859-1 或 UTF-8 代码集的以下语言名称和同义词:

Snowball 分析器支持属于 KOI-8 或 UTF-8 代码集的以下语言名称和同义词:Russian、ru、rus。

示例

在这些示例中,输入字符串显示在第一行,生成的标记显示在第二行,每个标记均以方括号括住。这些示例使用英语(由 analyzer="snowball.en" 索引参数指定)。有关 Snowball 分析器如何在英语之外的语言中使用单词衍生形态查询的示例,请参阅位于 http://snowball.tartarus.org 的 Snowball Web 站点。

在以下示例中,将除去非索引字,将词语转换为小写格式,并将词语“lazy”转换为其主干词:

The Quick Brown Fox Jumped Over The Lazy Dog
[quick] [brown] [fox] [jump] [over] [lazi] [dog]

在以下示例中,将忽略位于词语开始处的撇号以及后跟 s 的撇号,但对位于词语中间的撇号建立索引:

Prequ'ile Mark's 'cause 
[prequ'ile] [mark] [cause]

在以下示例中,将忽略冒号和反斜杠:

c:/informix 
[c] [informix]

在以下示例中,& 符号将作为公司名称的一部分建立索引:

XY&Z Corporation 
[xy&z] [corpor]

在以下示例中,将对电子邮件地址原样建立索引:

xyz@example.com
[xyz@example.com]

在以下示例中,将使用同一个主干词对三个不同的词语建立索引:

accept
[accept]

acceptable
[accept]

acceptance
[accept]


发送反馈 | 示例交流 | 故障诊断

要查找 PDF,请参阅 IBM Informix 12.10 系列产品的出版物
有关发行说明、文档说明和/或机器说明,请参阅发行说明页。
时间戳记 发行日期:2013 年 3 月