Tipy pre rozšírené vyhľadávanie

Spôsob vyhľadávania obsahu môžete meniť pomocou hľadania s čiastočnou zhodou, pomocou vyhľadávanie v rovnakej vete alebo pomocou hľadania koreňa slova. Rozšírené vyhľadávanie je relevantné len pri vyhľadávaní textových indexov. Vyhľadávanie textových indexov sa vykonáva na obsahu, ktorý má celotextový index. Svojho administrátora eDiscovery sa opýtajte, či môžete techniky rozšíreného vyhľadávania použiť na vami hľadaný obsah.

Obmedzenie: Rozšírené vyhľadávanie nie je podporované pre obsah, ktorý je archivovaný s IBM® FileNet Email Manager a je uložený na serveri IBM FileNet P8.

Vyhľadávanie s čiastočnou zhodou

Vyhľadávanie s čiastočnou zhodou vráti slová, ktoré sa píšu podobne ako vyhľadávací výraz. Tieto slová môžu alebo nemusia navzájom súvisieť. Hľadania s čiastočnou zhodou sú obzvlášť užitočné, ak ide o obsah, v ktorom by sa mohli nachádzať slová s pravopisnými chybami.

Vyhľadávanie s čiastočnou zhodou dostane nasledujúcu podobu:

Term~n

kde Term je hľadané slovo a n je hodnota podobnosti, ktorá je väčšia ako 0,0 a menšia ako 1,0.

Príklady vyhľadávaní s čiastočnou zhodou:
Lear~0.7
Vyhľadávanie s hodnotou podobnosti 0,7
Lear~0,5
Vyhľadávanie s hodnotou podobnosti 0,5
Kráľ AND Lear~0,5
Vyhľadávanie presnej zhody pre výraz King a čiastočnej zhody pre výraz Lear
Lear~0,5 NOT lean
Vyhľadá čiastočné zhody pre výraz Lear, ale nevráti zhody pre výraz lean, ktorý by mohol predstavovať čiastočnú zhodu pre výraz Lear
Poznámka: Vzhľadom na obmedzenia syntaxe nie je hodnota podobnosti podporovaná v prostrediach IBM FileNet P8 s IBM Legacy Content Search Engine. Ak zadáte hodnotu podobnosti, bude sa ignorovať; na vyhľadávaní sa nijako neprejaví.

Vyhľadávanie v rovnakej vete

Vyhľadávania v rovnakej vete, známe aj ako vyhľadávania blízkosti, môžu byť užitočné, ak sa dve slová nemusia vyskytovať v tom istom poradí, ale sa zvyčajne vyskytujú v rovnakej vete.

Vyhľadávanie v rovnakej vete nie je podporované v prostrediach FileNet P8 s IBM Content Search Services. Pokusy o vykonanie vyhľadávania v rovnakej vete v tomto prostredí nevrátia žiadne výsledky.

Ak ste napríklad zadali vyhľadávanie v rovnakej vete pre výraz Kráľ Lear, bude vrátený obsah, v ktorom sa nachádza niektorá z nasledujúcich viet:
King Lear was the most tragic character in all of Shakespeare's plays.
Lear is the most tragic king of all of Shakespeare's characters.
Vyhľadávanie v rovnakej vete Express:
(Výraz1 Výraz2) WITHIN SENTENCE
kde Výraz1 a Výraz2 sú dve slová, ktoré sa majú objaviť v rovnakej vete. Pri vyhľadávaní v rovnakej vete môžete špecifikovať len dva výrazy. Tieto dva výrazy musia byť uzatvorené do zátvoriek a musí za nimi nasledovať WITHIN SENTENCE. Ak napríklad chcete, aby sa v jednej vete objavili výrazy King a Lear, zadajte:
("King" "Lear") WITHIN SENTENCE
Ak chcete, aby sa výrazy Cordelia a King Lear vyskytovali v rovnakej vete, zadajte:
("Cordelia" "King Lear") WITHIN SENTENCE
Vyhľadávanie v rovnakej vete môžete kombinovať aj s inými vyhľadávanými výrazmi, napríklad:
(("King" "Louis") WITHIN SENTENCE) NOT nomination
Vyhľadávanie v rovnakej vete je vykonané na (Kráľ Louis) WITHIN SENTENCE a vráti obsah, v ktorom sa v tej istej vete nachádzajú slová kráľ a louis, tento obsah však neobsahuje slovo nominácia.

Podporu vyhľadávania v rovnakej vete poskytuje DB2 Net Search Extender, kde sa táto funkcia občas nazýva vyhľadávanie blízkosti. Bližšie informácie o tom ako DB2 Net Search Extender definuje koniec vety, nájdete v časti Odseky v téme Rozdelenie textu na bloky.

Hľadanie rovnakých viet nie je podporované pri obsahu, ktorý je archivovaný s IBM FileNet Email Manager a ktorý je uložený na serveri IBM FileNet P8.

Vyhľadávanie pomocou slovného kmeňa

Vyhľadávanie pomocou slovného kmeňa predstavujú dobrý spôsob vyhľadania slov s rovnakým slovným základom a pravidelnými koncovkami.

Obmedzenie: Vyhľadávanie pomocou slovného kmeňa je podporované len v angličtine.

Vyhľadávanie kmeňovej formy výrazu znamená redukovanie výrazu na jeho slovný kmeň a potom jeho vyhľadanie (známe tiež ako základné slovo). Napríklad vyhľadávanie slova kríky pomocou hľadanie koreňa slova vráti obsah, so slovami krík, kríkmi, a kríkom, ale niekrk, krok, ani ker.

Vyhľadávanie pomocou slovného kmeňa platí pre všetky samostatné výrazy vo vyhľadávaní s nasledujúcimi výnimkami:
  • Výrazy, označené pre vyhľadávanie s čiastočnou zhodou
  • Výrazy, obsahujúce zástupné znaky
  • Frázy (text uzatvorený medzi dvojité úvodzovky)
  • Vyhľadávanie rovnakej vety

Ak napríklad zadáte election OR nomination OR president~ OR hold* OR (King Lear) WITHIN SENTENCE ako vyhľadávané výrazy a potom zvolíte vykonanie vyhľadávania pomocou slovného kmeňa, vyhľadávanie pomocou slovného kmeňa sa použije len pre výrazy election a nomination.

Tip: Na vyhľadávanie väčšiny súvisiacich slov použite vyhľadávanie pomocou slovného kmeňa aj vyhľadávanie s čiastočnou zhodou. Napríklad hľadanie koreňa slova s výrazom krík vráti obsah, v ktorom sa nachádzajú slová kríky, kríkmi a kríkom, zatiaľ čo hľadanie s čiastočnou zhodou s výrazom krík vráti obsah so slovami krok, krič a kris a navyše aj ďalšie slová, ktoré sa odlišujú významom.

Podporu vyhľadávania pomocou slovného kmeňa poskytuje DB2 Net Search Extender. Kompletné informácie o vyhľadávaní pomocou slovného kmeňa nájdete v publikácii Net Search Extender Administration and User's Guide.

V prostrediach IBM FileNet P8, ktoré využívajú IBM Content Search Services sa pri vyhľadávaní v obsahu namiesto vyhľadávania koreňa slova používa lematizácia. Lematizácia je určenie lemy (základného, "slovníkového" tvaru slova) na základe algoritmu. Hlavný rozdiel medzi lematizáciou a vyhľadaním koreňa slova je v tom, že lematizácia pracuje nielen so slovom, ale aj s jeho kontextom. Napríklad:
  • Lema slova "lepší" je "dobrý". Pri vyhľadávaní koreňa slova sa toto prepojenie stráca, pretože by to vyžadovalo vyhľadávanie v slovníku.
  • Slovo "zlomiť" je základným tvarom slova "zlomia", preto slovo "zlomiť" nájde aj lematizácia, aj vyhľadávanie koreňa slova.
  • Slovo "versioning" môže byť v angličtine buď základnou formou podstatného mena (vytváranie verzií) alebo formou slovesa (vzťahujúci sa k verzii), a to v závislosti na kontexte. Lematizácia môže na základe kontextu určiť správnu lemu pre slovo "versioning". Napríklad vo vete "The versioning support in this product is fantastic" by algoritmus lematizácie zvolil formu podstatného mena "versioning" a identifikoval by lemu ako "versioning", čo je pôvodný symbol vyhľadávania.

Vyhľadávanie v rámci rozsahu hodnôt v celočíselných poliach

Syntax
relational_operator integer [ boolean_operator relational_operator integer] [ boolean_operator relational_operator integer] ...
pričom:

relational_operator môže byť >, <, >=, <=, =, != alebo <>

boolean_operator môže byť buď AND alebo OR

Implicitné poradie priority operátorov je najprv AND, potom OR. Implicitné poradie je možné zmeniť zátvorkami.

V nasledujúcich príkladoch sú zobrazené možnosti zostavenia dotazov:
TIEFLAG: 	10000 

TIEFLAG: 	=10000 

TIEFLAG: 	<10000 

TIEFLAG: 	<>10000 

TIEFLAG: 	>=10000 AND <=20000  

TIEFLAG: 	>=10000 AND <=20000 OR =15000 

TIEFLAG: 	!=5000 AND (>20000 OR <10000) AND !=25000