替代/同義字字典

替代字典是由詞彙組成的集合,可幫助將類似的詞彙群組在一個目標詞彙下。替代字典是在「檔案庫資源」標籤的底端窗格中管理。您可以透過功能表中的檢視 > 資源編輯器存取此視圖,如果您在互動式工作台階段作業中。 否則,您可以在範本編輯器中編輯特定範本的字典

您可以在這個字典中定義兩種形式的替代:同義字選用元素。按一下此窗格中的標籤即可在它們之間切換。

在文字資料上執行擷取之後,您可能會發現數個本身為同義字的概念或是其他概念的受影響表單。透過識別選用元素和同義字,您可以強制擷取引擎將這些對映到一個單一目標詞彙。

使用同義字和選用元素進行替換會減少「擷取結果」窗格中的概念數,因為將它們結合在一起成為具有較高頻率 Doc. 計數的更有意義、代表性的概念。

同義字

同義字會將兩個或多個具有相同意義的單字產生關聯。您也可以使用同義字來將詞彙與它們的縮寫群組,或是將一般誤拼的單字與正確的拼字群組。您可以在「同義字」標籤上定義這些同義字。

同義字定義由兩個部分組成。第一個部分是目標詞彙,這是您要擷取引擎將所有同義字群組在其下的詞彙。除非使用此目標詞彙作為另一個目標詞彙的同義字,或是除非它已被排除,否則它很可能變成出現在「擷取結果」窗格中的概念。第二個部分是同義字清單,這些同義字將會群組在目標詞彙下。

比方說,如果您要 automobilevehicle 所取代,則 automobile 是同義字,而 vehicle 是目標詞彙。

您可以在同義字直欄中輸入任何同義字,但是如果在擷取期間找不到該單字,且詞彙具有含 Entire 的符合選項,則無法進行任何替代。不過,要將同義字群組在此詞彙下並不需要擷取目標詞彙。

選用元素

選用元素識別複合詞彙中在擷取期間可以忽略的選用單字,使得即使類似的詞彙在文字中顯得有點不同,也能讓它們放在一起。選用元素是單一單字,如果從複合詞彙中加以移除,則可以建立與另一個詞彙的相符項。這些單一單字可能會出現在複合詞彙內的任何地方:在開頭、中間或結尾。您可以在「選用」標籤上定義選用元素。

比方說,如果要將詞彙 ibmibm corp 群組在一起,您應宣告要將 corp 視為此案例中的選用元素處理。在另一個範例中,如果您要將詞彙 access 指定為選用元素,並在擷取期間同時發現 internet access speedinternet speed,則會在最常出現的詞彙下將它們群組在一起。