1. 程式人生 > >全文檢索工具迅搜的安裝和體驗(可用於自建中文全文搜尋引擎)

全文檢索工具迅搜的安裝和體驗(可用於自建中文全文搜尋引擎)

1、Ubuntu環境下安裝:
   1)LNMP安裝:參考https://lnmp.org/install.html
     #wget -c http://mirrors.duapp.com/lnmp/lnmp1.3-full.tar.gz && tar zxf lnmp1.3-full.tar.gz && cd lnmp1.3-full && ./install.sh lnmp
      mysql的root密碼設定為mysql,選擇mysql 5.7.11和php7.0.7安裝;
      安裝了兩個小時多,提示Install lnmp V1.3 completed! enjoy it.不容易啊!
   2)下載解壓:
     #wget http://www.xunsearch.com/download/xunsearch-full-latest.tar.bz2
     #tar -xjf xunsearch-full-latest.tar.bz2
   3)安裝:
     #cd xunsearch-full-1.4.10/
     #sh setup.sh
     提示輸入安裝目錄,這裡設為/home/xunsearch
   4)啟動:
     #cd /home/xunsearch
     #bin/xs-ctl.sh restart
   5)檢測PHP-SDK執行環境:
     #cd /home/xunsearch
     #sdk/php/util/RequiredCheck.php
     如果是GBK環境在最後加上 -c GBK,如果php不是在預設安裝目錄()下則切換到php安裝目錄下執行;
   6)關閉和刪除:
     #cd /home/xunsearch
     #bin/xs-ctl.sh faststop  關閉
     #rm -rf /home/xunsearch  刪除安裝目錄即可


2、Demo體驗
   1)專案配置檔案:
     #cd /home/xunsearch
     #cat sdk/php/app/demo.ini
     配置檔案預設連線本地的 8383、8384埠並使用UTF-8編碼,包含四個欄位:pid,subject,message,chrono;
   2)填充索引資料:
     sdk/php/util/Indexer.php管理索引資料匯入,可以匯入mysql資料表、json格式以及制定分隔符的CSV檔案;
     下面命令設定匯入資料csv格式並清空demo庫內當前的索引資料
     #sdk/php/util/Indexer.php --source=csv --clean demo
     輸入:
     1,關於 xunsearch 的 DEMO 專案測試,專案測試是一個很有意思的行為!,1314336158
     2,測試第二篇,這裡是第二篇文章的內容,1314336160
     3,專案測試第三篇,俗話說,無三不成禮,所以就有了第三篇,1314336168
     回車按ctrl+D退出;
   3)測試搜尋:
     #cd /home/xunsearch
     #sdk/php/util/Quest.php demo 搜尋內容
     每個搜尋後的關鍵詞系統都會記錄下來進行分析,並儲存在日誌中用於統計熱門搜尋、搜尋建議、相關搜尋等。
     預設情況系統會每 2 小時進行一次更新日誌,可使用以下指令進行強制重新整理。
     #sdk/php/util/Indexer.php --flush-log demo
     複雜搜尋:
     #sdk/php/util/Quest.php demo subject:內容
     #sdk/php/util/Quest.php demo pid:2
     #sdk/php/util/Quest.php demo "第三篇 OR pid:1"
     日誌相關的搜尋:其中--suggest 是搜尋建議,當用戶敲入少許漢字或字母時給出相應的關鍵詞建議(常用於搜尋輸入框下拉自動提示),而 --related 表示相關搜尋、--hot 表示熱門搜尋、 --correct 表示搜尋糾錯。
     #sdk/php/util/Quest.php --hot demo 
     #sdk/php/util/Quest.php --related demo 專案
     #sdk/php/util/Quest.php --correct demo yunsearch

     #sdk/php/util/Quest.php --suggest demo 項

3、建立mysql索引庫
1)匯入CSV檔案到mysql
#mysql -u root -p
密碼:mysql
#create database xunsearch;
#create table csv(pid varchar(50),subject varchar(100),message varchar(200),chrono varchar(20));
把csv檔案放在/home/xunsearch/data目錄下
#load data infile '/home/xunsearch/data/demo.csv' replace into table csv CHARACTER SET gb2312 fields terminated by ',';

2)匯入mysql到索引庫
  
按照這個格式--source=mysql://[user[:passwd]@]host/dbname[/table]
#sdk/php/util/Indexer.php --source=mysql://root:

[email protected]/xunsearch/csv --clean demo
3)搜尋
#sdk/php/util/Quest.php demo 內容

#sdk/php/util/Quest.php --hot demo 

4、PHP程式碼不是很熟悉,有興趣者可以自己搭建一個搜尋引擎,然後編寫php驅動。

相關推薦

全文檢索工具安裝體驗用於中文全文搜尋引擎

1、Ubuntu環境下安裝:    1)LNMP安裝:參考https://lnmp.org/install.html      #wget -c http://mirrors.duapp.com/lnmp/lnmp1.3-full.tar.gz && tar

XShell安裝配置系統為虛擬機器中的centos7

    首先解釋一下XShell這款工具,它可以用來遠端操控Linux系統,所以我們可以在Windows系統中,安裝這個軟體來開啟Linux終端,下面來介紹一下XShell的安裝和配置過程: 1.新建

CentOS7安裝iptables防火牆禁用/停止帶的firewalld服務

使用背景:  1,CentOS7 預設的防火牆 不是iptables, 而是firewalle.  2,一些軟體的埠號要放開來提供服務,如:22,80等常用埠 3,提供web服務的需要 使用步驟: 一,安裝centos7,自行百度 三,CentOS7安裝ipt

接口測試工具soapUI的安裝使用方法詳解

service 技術 key custom media 負載 bmp file text soapUI是一個開源測試工具,通過soap/http來檢查、調用、實現Web Service的功能/負載/符合性測試。 使用soapUI可以非常方便的實現接口的功能測試、穩

自動化工具ansible的安裝使用

ansible 自動化工具 ansible自動化工具 自動化工具ansible的安裝和使用 操作系統:centos6.8 服務端ip:192.168.137.142 客戶端ip: 192.168.137.34 192.168.137.33 安裝ans

Elasticsearch全文檢索工具入門

使用步驟 artifact rop 創建 是否 方式 cluster 包名 Lucene 1 Elasticsearch全文檢索工具入門: 2 1.下載對應系統版本的文件 3 elasticsearch-2.4.0.zip 4

Mysql 性能測試工具 sysbench的安裝使用

library serve dia ransac 2.6 需要 option 5.7 hive 工作上需要用到AWS和Azure的Mysql服務,需要測試比較一下兩個雲服務的性能。於是開始百度 + google,查找性能測試工具。最終決定用sysbench。sys

漏洞掃描工具Nessu的安裝簡單使用

掃描工具 tps sbin 遙控 init.d 家庭 -i 目錄 路徑 一、軟件介紹Nessus號稱是世界上最流行的漏洞掃描程序,全世界有超過75000個組織在使用它。該工具提供完整的電腦漏洞掃描服務,並隨時更新其漏洞數據庫。Nessus不同於傳統的漏洞掃描軟件,Nessu

npm 工具(用來安裝管理nodejs包的一個工具。所有使用nodejs第三方庫的項目,都需要在項目初始化的時候 使用 npm init 命令來初始項目)

des auth 暫時 cif 通過 作用 hello amp `` 新建項目 npm init```package.json ```{ "name": "webpackdemo1", 項目名稱,包名,不能是grunt或webpack "version": "1.

網站效能測試工具 webbench 的安裝使用

1.webbench的下載和安裝 wget http://home.tiscali.cz/~cz210552/distfiles/webbench-1.5.tar.gz sudo tar xvf webbench-1.5.tar.gz  -C /usr/local/ cd /usr/l

自動化運維工具Puppet服務安裝部署詳解

puppet簡介 puppet是一種基於ruby語言開發的Lnux、Unix、windows平臺的集中配置管理系統。它使用自有的puppet描述語言,可管理配置檔案file、使用者user、cron任務、軟體包、系統服務等系統實體。 puppet依賴於C/S(客戶端/伺服器)的部署架構。它需要在p

**全文檢索工具_Lucence*

課程計劃: 1. 什麼是全文檢索,如何實現全文檢索 2. Lucene實現全文檢索的流程 * 建立索引 * 查詢索引 3. 配置開發環境 4. 入門程式 5. 分析器的分析過程 1. 測試分析器的分析效果 2. 第三方中文分析器 6. 索引庫維護 1.

shell加密工具shc的安裝使用

1) 工具說明 shell指令碼是可讀寫的, 很有可能會洩露敏感資訊, 如使用者名稱/密碼/路徑/IP等. 同樣在shell指令碼執行時會也洩露敏感資訊. shc是一個加密shell指令碼的工具, 它的作用是把shell指令碼轉換為一個可

node管理工具 nvm 下載安裝使用

首先  需要解除安裝掉我們的node及之前配置好的環境變數 還有c盤使用者下的.npmrc的檔案 下載nvm   點我  下載最新版本中  noinstall.zip的檔案 然後解壓到你要存放的目錄裡    我放在了 D

抓包工具Charles的安裝使用

一、Charles的安裝和使用 1、下載官網地址為:https://www.charlesproxy.com/ 2、下載完成以後,雙擊Charles-proxy-4.2.5-win64.msi     3、點選Next 4、勾選I acc

抓報工具(Fiddler or )安裝下載

Fiddler:fiddler(百度百科) fiddler的官方下載連結:https://www.telerik.com/download/fiddler 也可以  點選 去下載 安裝步驟沒什麼特別,常規下一步完成即可。 2.設定fiddler 裡有兩點需要說

Python+Selenium中級篇之1-Python IDE工具-PyCharm的安裝簡單使用

       從本文開始陸續介紹一些中級的技能,本篇文章介紹,在Python開發過程中,比較流行,很優秀的一款IDE工具-PyCharm,這裡關於它的介紹就一句話,它就相當於Java開發中的Eclip

Win10下使用系統工具Hyper-V安裝使用Win7虛擬機器

目錄 1.安裝win7虛擬機器 進入【程式】,在【程式和功能】中選擇【啟用或關閉Windows功能】然後點選進入。   在【啟用或者關閉Windows功能】中找到【Hyper-V】然後點選勾選它前面的框。然後【確定儲

內網穿透工具ngrok的安裝使用,超簡單~

寫在前面: ngrok可以做內網穿透,外網對映,可以用其他任何有網的裝置訪問你當前開啟對映的埠專案~ 全域性安裝ngrok npm install ngrok -g 如果本地起了一個服務,埠號為3001。則輸入以下命令: ngrok http 3001

Lucene全文檢索工具包學習筆記總結

Lucene—-全文檢索的工具包 隸屬於apache(solr也是屬於apache,solr底層的實現是Lucene) 一、資料的分類: 結構化資料 具有固定型別和長度的資料 比如:資料庫(mysql/oracl)中的資料,元資料(windows中的檔案) 非結構化資料