自然語言處理隨筆(一)
阿新 • • 發佈:2018-01-01
索引 中國 大學 import pip for earch 清華 北京
安裝jieba中文分詞命令:pip install jieba
簡單的例子:
import jieba
seg_list = jieba.cut("我來到北京清華大學", cut_all=True)
print("Full Mode:", "/ ".join(seg_list)) # 全模式
seg_list = jieba.cut("我來到北京清華大學", cut_all=False)
print("Default Mode:", "/ ".join(seg_list)) # 精確模式
seg_list = jieba.cut("他來到了網易杭研大廈") # 默認是精確模式
print(", ".join(seg_list))
seg_list = jieba.cut_for_search("小明碩士畢業於中國科學院計算所,後在日本京都大學深造") # 搜索引擎模式
print(", ".join(seg_list))
結果:
Full Mode: 我/ 來到/ 北京/ 清華/ 清華大學/ 華大/ 大學 Default Mode: 我/ 來到/ 北京/ 清華大學 他, 來到, 了, 網易, 杭研, 大廈 小明, 碩士, 畢業, 於, 中國, 科學, 學院, 科學院, 中國科學院, 計算, 計算所, ,, 後, 在, 日本, 京都, 大學, 日本京都大學, 深造
自然語言處理隨筆(一)