solr5.3.1 整合IK中文分詞器

阿新 • • 發佈：2019-01-06

參考文章：http://www.cnblogs.com/sword-successful/p/5604541.html

轉載文章：http://www.cnblogs.com/pazsolr/p/5796813.html

1.下載IK分詞器包。

連結：http://pan.baidu.com/s/1i4D0fZJ 密碼：bcen

2.解壓並把IKAnalyzer5.3.1.jar 、IK-Analyzer-extra-5.3.1.jar拷貝到tomcat/webapps/solr/WEB-INF/lib下。

3.修改schema.xml配置檔案，如下：

修改後的配置檔案

<?xml version="1.0" encoding="UTF-8" ?>
<schema name="example" version="1.5">
   <field name="_version_" type="long" indexed="true" stored="true"/>
   <field name="_root_" type="string" indexed="true" stored="false"/>
   <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" /> 
   <field name="title" type="text_ik" indexed="true" stored="true" multiValued="true"/>
   <field name="subject" type="text_ik" indexed="true" stored="true"/>
   <field name="description" type="text_ik" indexed="true" stored="true"/>
   <field name="text" type="text_ik" indexed="true" stored="false" multiValued="true"/>
  
   <uniqueKey>id</uniqueKey>
  
   <copyField source="title" dest="text"/>
   <copyField source="subject" dest="text"/>
   <copyField source="description" dest="text"/>
  
   <fieldType name="string" class="solr.StrField" sortMissingLast="true" />
   <fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/>
   <fieldType name="date" class="solr.TrieDateField" precisionStep="0" positionIncrementGap="0"/>
    
   <fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
    <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
   </fieldType>
   
   <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
      <analyzer type="index">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
      <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
   </fieldType>
</schema>

修改完成之後儲存並重啟solr伺服器。

solr5.3.1 整合IK中文分詞器

參考文章：http://www.cnblogs.com/sword-successful/p/5604541.html 轉載文章：http://www.cnblogs.com/pazsolr/p/5796813.html 1.下載IK分詞器包。連結：http://

Elasticsearch5.5.1安裝IK中文分詞器

安裝步驟：一、參照官方文件安裝IK分詞器 1、直接到https://github.com/medcl/elasticsearch-analysis-ik/releases下載對應版本zip包解壓到elasticsearch的plugin目錄下 unzip elasti

solr5.x整合IK中文分詞

在solr5.x中加入IK中文分詞，首先要下載適用於solr5.x版本的IK對應的jar檔案把下載下來的jar包放到solr/WEB-INF/lib下然後我們需要在mynode（具體看搭建環境那塊）中的conf檔案下找到schema.xml。並在其最後加上： &l

solr5.5版本中ik中文分詞配置

這裡我使用的是solr5.5進行匹配的分詞器首先需要先下載IKAnalyzer 分詞器下載地址: IK分詞器jar 將下載好的jar 放到 webapps\solr\WEB-INF\lib

solr7.7.1加ik中文分詞安裝筆記

use 51cto filter vpd oss mit tex su - arc 1、準備工作到官網下載個jdk8安裝上去 [root@Track2 solr]# rpm -ivh jdk-8u121-linux-x64.rpm Preparing...

Solr6.6.0添加IK中文分詞器

其中開發其余下載鏈接 classes 項目實現 .com 擴展 IK分詞器就是一款中國人開發的，擴展性很好的中文分詞器，它支持擴展詞庫，可以自己定制分詞項，這對中文分詞無疑是友好的。 jar包下載鏈接：http://pan.baidu.com/s/1o85I15o

Solr6.2搭建和配置ik中文分詞器

首先需要的準備好ik分詞器,因為Solr6.0版本比較高,所以ik分詞器的版本最好高一點,我是用ikanalyzer-solr5來搭建的. 第一步解壓ikanalyzer-solr5. 第二步複製ik-analyzer-solr5-5.x.jar並將其放在solr-6.2.1\se

IK中文分詞器安裝

分詞器路徑 https://github.com/medcl/elasticsearch-analysis-ik/releases 下載與elasticsearch一樣的版本 wget https://github.com/medcl/elasticsearch-analysis-ik/

學習筆記:從0開始學習大資料-29. solr增加ik中文分詞器並匯入doc，pdf文件全文檢索

環境 centos7,solr7.5.0 1. 新建core 從 solr-7.5.0/example/files/conf 作為配置檔案模板，建立core，名為mycore 2.下載分詞器從https://search.maven.org/search?q=g:com

solr 6.2.0系列教程（二）IK中文分詞器配置及新增擴充套件詞、停止詞、同義詞

前言 2、solr的不同版本，對應不同版本的IK分詞器。由於IK 2012年停止更新了。所以以前的版本不適合新版的solr。有幸在網上扒到了IK原始碼自己稍微做了調整，用來相容solr6.2.0版本。IK原始碼下載地址步驟 1、解壓下載的src.rar壓縮包，這是我建

淘淘商城23_solr在Linux上的操作02_安裝IK中文分詞器

一、思想 1、在solr中預設是沒有中文分析器，需要手工配置，配置一個FieldType，在FieldType中指定中文分析器。 2、Solr中的欄位必須是先定義後使用。二、步驟 1. 配置IKAnalyzer的jar包將上面圖片中的IK Analyze

ElasticSearch系列五：掌握ES使用IK中文分詞器

一、內建分詞器的介紹例：Set the shape to semi-transparent by calling set_trans(5)standard analyzer（預設）：set, the, shape, to, semi, transparent, by, cal

solr8.0 ik中文分詞器的簡單配置（二）

false ima pan Lucene 停止 pre top 其它 span 下載ik分詞器，由於是solr8.0，一些ik分詞器版本可能不兼容，以下是個人親測可行的版本鏈接：https://pan.baidu.com/s/1_Va-9af-jMcqepGQ9nWo3

ES[7.6.x]學習筆記（七）IK中文分詞器

在上一節中，我們給大家介紹了ES的分析器，我相信大家對ES的全文搜尋已經有了深刻的印象。分析器包含3個部分：字元過濾器、分詞器、分詞過濾器。在上一節的例子，大家發現了，都是英文的例子，是吧？因為ES是外國人寫的嘛，中國如果要在這方面趕上來，還是需要螢幕前的小夥伴們的~ 英文呢，我們可以按照空格將一句話、一

ElasticSearch-6.4.1安裝中文分詞器Analysis-ik.

一：使用背景和安裝過程. 1. ElasticSearch-6.4.1.(Windows環境下) &nbs

elasticsearch6.x ik中文分詞整合

Elasticsearch是一個基於Apache Lucene(TM)的開源、實時分散式搜尋和分析引擎。它用於全文搜尋、結構化搜尋、分析以及將這三者混合使用。IK Analysis外掛將Lucene IK分析器整合到elasticsearch中，支援自定義詞典。 1. 選擇

Solr 7.2.1 配置中文分詞器 IK Analyzer

一、什麼是中文分詞器？為什麼不來個英文分詞器呢？ “嘿，小夥子，就是你，說的就是你，你那麼有才咋不上天呢！” 首先我們來拽一句英文：“He is my favorite NBA star”

（四）Solr6.4.1配置中文分詞器IK Analyzer詳解

Solr6.4.1配置中文分詞器IK Analyzer詳解 2.把IKAnalyzer.cfg.xml，mydict.dic，stopword.dic這三個檔案複製放入tomcat/solr專案web-info的classes下 3.把ik-analyz

es5.4安裝head、ik中文分詞插件

es安裝maven打包工具wget http://mirror.bit.edu.cn/apache/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.tar.gz tar -xf apache-maven-3.3.9-bin.tar.gz mv apach

solrcloud配置中文分詞器ik

lte config server field per str load fonts textfield 無論是solr還是luncene,都對中文分詞不太好，所以我們一般索引中文的話需要使用ik中文分詞器。三臺機器（192.168.1.236，192.168.1.237

solr5.3.1 整合IK中文分詞器

相關推薦