Tipy pre rozšírené vyhľadávanie
Spôsob vyhľadávania obsahu môžete meniť pomocou hľadania s čiastočnou zhodou, pomocou vyhľadávanie v rovnakej vete alebo pomocou hľadania koreňa slova. Rozšírené vyhľadávanie je relevantné len pri vyhľadávaní textových indexov. Vyhľadávanie textových indexov sa vykonáva na obsahu, ktorý má celotextový index. Svojho administrátora eDiscovery sa opýtajte, či môžete techniky rozšíreného vyhľadávania použiť na vami hľadaný obsah.
Vyhľadávanie s čiastočnou zhodou
Vyhľadávanie s čiastočnou zhodou vráti slová, ktoré sa píšu podobne ako vyhľadávací výraz. Tieto slová môžu alebo nemusia navzájom súvisieť. Hľadania s čiastočnou zhodou sú obzvlášť užitočné, ak ide o obsah, v ktorom by sa mohli nachádzať slová s pravopisnými chybami.
Vyhľadávanie s čiastočnou zhodou dostane nasledujúcu podobu:
Term~n
kde Term je hľadané slovo a n je hodnota podobnosti, ktorá je väčšia ako 0,0 a menšia ako 1,0.
- Lear~0.7
- Vyhľadávanie s hodnotou podobnosti 0,7
- Lear~0,5
- Vyhľadávanie s hodnotou podobnosti 0,5
- Kráľ AND Lear~0,5
- Vyhľadávanie presnej zhody pre výraz King a čiastočnej zhody pre výraz Lear
- Lear~0,5 NOT lean
- Vyhľadá čiastočné zhody pre výraz Lear, ale nevráti zhody pre výraz lean, ktorý by mohol predstavovať čiastočnú zhodu pre výraz Lear
Vyhľadávanie v rovnakej vete
Vyhľadávania v rovnakej vete, známe aj ako vyhľadávania blízkosti, môžu byť užitočné, ak sa dve slová nemusia vyskytovať v tom istom poradí, ale sa zvyčajne vyskytujú v rovnakej vete.
Vyhľadávanie v rovnakej vete nie je podporované v prostrediach FileNet P8 s IBM Content Search Services. Pokusy o vykonanie vyhľadávania v rovnakej vete v tomto prostredí nevrátia žiadne výsledky.
Lear is the most tragic king of all of Shakespeare's characters.
(Výraz1 Výraz2) WITHIN SENTENCE
("King" "Lear") WITHIN SENTENCE
("Cordelia" "King Lear") WITHIN SENTENCE
(("King" "Louis") WITHIN SENTENCE) NOT nomination
Vyhľadávanie v rovnakej vete je vykonané na (Kráľ Louis) WITHIN SENTENCE a vráti obsah, v ktorom sa v tej istej vete nachádzajú slová kráľ a louis, tento obsah však neobsahuje slovo nominácia.Podporu vyhľadávania v rovnakej vete poskytuje DB2 Net Search Extender, kde sa táto funkcia občas nazýva vyhľadávanie blízkosti. Bližšie informácie o tom ako DB2 Net Search Extender definuje koniec vety, nájdete v časti Odseky v téme Rozdelenie textu na bloky.
Hľadanie rovnakých viet nie je podporované pri obsahu, ktorý je archivovaný s IBM FileNet Email Manager a ktorý je uložený na serveri IBM FileNet P8.
Vyhľadávanie pomocou slovného kmeňa
Vyhľadávanie pomocou slovného kmeňa predstavujú dobrý spôsob vyhľadania slov s rovnakým slovným základom a pravidelnými koncovkami.
Vyhľadávanie kmeňovej formy výrazu znamená redukovanie výrazu na jeho slovný kmeň a potom jeho vyhľadanie (známe tiež ako základné slovo). Napríklad vyhľadávanie slova kríky pomocou hľadanie koreňa slova vráti obsah, so slovami krík, kríkmi, a kríkom, ale niekrk, krok, ani ker.
- Výrazy, označené pre vyhľadávanie s čiastočnou zhodou
- Výrazy, obsahujúce zástupné znaky
- Frázy (text uzatvorený medzi dvojité úvodzovky)
- Vyhľadávanie rovnakej vety
Ak napríklad zadáte election OR nomination OR president~ OR hold* OR (King Lear) WITHIN SENTENCE ako vyhľadávané výrazy a potom zvolíte vykonanie vyhľadávania pomocou slovného kmeňa, vyhľadávanie pomocou slovného kmeňa sa použije len pre výrazy election a nomination.
Podporu vyhľadávania pomocou slovného kmeňa poskytuje DB2 Net Search Extender. Kompletné informácie o vyhľadávaní pomocou slovného kmeňa nájdete v publikácii Net Search Extender Administration and User's Guide.
- Lema slova "lepší" je "dobrý". Pri vyhľadávaní koreňa slova sa toto prepojenie stráca, pretože by to vyžadovalo vyhľadávanie v slovníku.
- Slovo "zlomiť" je základným tvarom slova "zlomia", preto slovo "zlomiť" nájde aj lematizácia, aj vyhľadávanie koreňa slova.
- Slovo "versioning" môže byť v angličtine buď základnou formou podstatného mena (vytváranie verzií) alebo formou slovesa (vzťahujúci sa k verzii), a to v závislosti na kontexte. Lematizácia môže na základe kontextu určiť správnu lemu pre slovo "versioning". Napríklad vo vete "The versioning support in this product is fantastic" by algoritmus lematizácie zvolil formu podstatného mena "versioning" a identifikoval by lemu ako "versioning", čo je pôvodný symbol vyhľadávania.
Vyhľadávanie v rámci rozsahu hodnôt v celočíselných poliach
relational_operator integer [ boolean_operator relational_operator integer] [ boolean_operator relational_operator integer] ...
pričom: relational_operator môže byť >, <, >=, <=, =, != alebo <>
boolean_operator môže byť buď AND alebo OR
Implicitné poradie priority operátorov je najprv AND, potom OR. Implicitné poradie je možné zmeniť zátvorkami.
TIEFLAG: 10000
TIEFLAG: =10000
TIEFLAG: <10000
TIEFLAG: <>10000
TIEFLAG: >=10000 AND <=20000
TIEFLAG: >=10000 AND <=20000 OR =15000
TIEFLAG: !=5000 AND (>20000 OR <10000) AND !=25000