999 - Elasticsearch Analysis 04 - Token Filter

阿新 • • 發佈：2019-12-31

太多了不想寫了，隨便寫了兩個，這個根據需要去官網看檔案吧。

ASCII Folding Token Filter

轉為Ascii碼等效項。

Length Token Filter

刪除過長、過短的字詞。

引數	說明
min	最小數值. 預設 0.
max	最大數值. 預設 Integer.MAX_VALUE.

Lowercase Token Filter

小寫詞元。

引數	說明
language	greek,irish,turkish

Uppercase Token Filter

大寫詞元

NGram Token Filteredit

nGram詞元過濾器。

引數	說明
min_gram	預設為1。
max_gram	預設為2。

Edge NGram Token Filter

edgeNGram詞元過濾器。

引數	說明
min_gram	預設為1。
max_gram	預設為2。
side	已棄用。front或back，預設front。

Stop Token Filteredit

刪除停止詞。

引數	說明
stopwords	停止詞列表。預設`_english_`。
stopwords_path	停止詞檔案。檔案路徑相對於config目錄或使用絕對路徑。每個停止詞必須單獨一行。檔案為UTF-8編碼。
ignore_case	設為true所有詞被轉為小寫。預設false。
remove_trailing	設定為false忽略最後一個字詞是停止詞的情況。預設true。

999 - Elasticsearch Analysis 04 - Token Filter

太多了不想寫了，隨便寫了兩個，這個根據需要去官網看檔案吧。 ASCII Folding Token Filter

999 - Elasticsearch Analysis 05 - Character Filter

HTML Strip Character Filter 將html元素替換成對應的解碼值（例如&替換成&)。

999 - Elasticsearch Analysis 01

簡介 Analysis在建立索引或搜尋時指定，將文字解析成倒排索引，以供搜尋。簡單解釋下倒排索引：通常書本的目錄就是正排索引，根據目錄找章節；而倒排索引就是根據內容（例如一個單詞）找所在的章節。

999 - Elasticsearch Analysis 02 - Analyzer

Standard Analyzer 預設的analyzer，適合大多數語言。根據Unicode Text Segmentation演演算法的定義，將文字切分成詞元。

999 - Elasticsearch Analysis 03 - Tokenizer

Word Oriented Tokenizers 下面的tokenizer主要用來切分文字為單個單詞。 Standard Tokenizer

999 - Elasticsearch 環境搭建

搭建環境說明官方支援的作業系統和JVM 支援Oracle JDK和Open JDK。 JDK8以上，推薦1.8.0_131或以上。

999 - Elasticsearch 基本概念

Elasticsearch 簡介 Elasticsearch是一個高可擴充套件的，全文搜尋分析引擎。可以近實時地儲存、搜尋以及分析海量資料。

999 - Elasticsearch 快速上手

Elasticsearch REST API Elasticsearch提供了全面強大的REST API：檢查叢集、節點、索引的健康、狀態以及統計資訊。

Zuul token FIlter 驗證失敗結果輸出

1、背景用 postman 測試zuul 閘道器路由成功和失敗的時候，發現路由成功的時候，返回的結構體是 json 格式，但是路由失敗的時候，返回的是空。結構體居然不一樣，這對呼叫方來說也要瘋了。

ES新增elasticsearch-analysis-ik分詞器

1、下載分詞器包 https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v5.4.3 2、將分詞器解壓並放入plugins目錄下。（一定要在plugins下面建立一個ik檔案，然後將解壓的elasticsearch-analysis-ik檔