999 - Elasticsearch Analysis 04 - Token Filter
阿新 • • 發佈:2019-12-31
太多了不想寫了,隨便寫了兩個,這個根據需要去官網看檔案吧。
ASCII Folding Token Filter
轉為Ascii碼等效項。
Length Token Filter
刪除過長、過短的字詞。
引數 | 說明 |
---|---|
min | 最小數值. 預設 0. |
max | 最大數值. 預設 Integer.MAX_VALUE. |
Lowercase Token Filter
小寫詞元。
引數 | 說明 |
---|---|
language | greek,irish,turkish |
Uppercase Token Filter
大寫詞元
NGram Token Filteredit
nGram
詞元過濾器。
引數 | 說明 |
---|---|
min_gram | 預設為1。 |
max_gram | 預設為2。 |
Edge NGram Token Filter
edgeNGram
詞元過濾器。
引數 | 說明 |
---|---|
min_gram | 預設為1。 |
max_gram | 預設為2。 |
side | 已棄用。front或back,預設front。 |
Stop Token Filteredit
刪除停止詞。
引數 | 說明 |
---|---|
stopwords | 停止詞列表。預設_english_ 。 |
stopwords_path | 停止詞檔案。 檔案路徑相對於config目錄或使用絕對路徑。 每個停止詞必須單獨一行。 檔案為UTF-8編碼。 |
ignore_case | 設為true所有詞被轉為小寫。預設false。 |
remove_trailing | 設定為false忽略最後一個字詞是停止詞的情況。預設true。 |