1. 程式人生 > 程式設計 >999 - Elasticsearch Analysis 04 - Token Filter

999 - Elasticsearch Analysis 04 - Token Filter

太多了不想寫了,隨便寫了兩個,這個根據需要去官網看檔案吧。

ASCII Folding Token Filter

轉為Ascii碼等效項。

Length Token Filter

刪除過長、過短的字詞。

引數 說明
min 最小數值. 預設 0.
max 最大數值. 預設 Integer.MAX_VALUE.

Lowercase Token Filter

小寫詞元。

引數 說明
language greek,irish,turkish

Uppercase Token Filter

大寫詞元

NGram Token Filteredit

nGram詞元過濾器。

引數 說明
min_gram 預設為1。
max_gram 預設為2。

Edge NGram Token Filter

edgeNGram詞元過濾器。

引數 說明
min_gram 預設為1。
max_gram 預設為2。
side 已棄用。front或back,預設front。

Stop Token Filteredit

刪除停止詞。

引數 說明
stopwords 停止詞列表。預設_english_
stopwords_path 停止詞檔案。
檔案路徑相對於config目錄或使用絕對路徑。
每個停止詞必須單獨一行。
檔案為UTF-8編碼。
ignore_case 設為true所有詞被轉為小寫。預設false。
remove_trailing 設定為false忽略最後一個字詞是停止詞的情況。預設true。