python實現遞迴查詢某個路徑下所有檔案中的中文字元

阿新 • • 發佈：2020-01-09

本文例項為大家分享了python實現遞迴查詢某個路徑下所有檔案中的中文字元，供大家參考，具體內容如下

# -*- coding: utf-8 -*-
# @ description:
# @ author: 
# @ created: 2018/7/21
 
import re
import sys
import os
 
reload(sys)
sys.setdefaultencoding("utf8")
 
 
def translate(str):
  out = set()
  line = str.strip().decode('utf-8','ignore') # 處理前進行相關的處理，包括轉換成Unicode等
  p2 = re.compile(ur'[^\u4e00-\u9fa5]') # 中文的編碼範圍是：\u4e00到\u9fa5
  zh = " ".join(p2.split(line)).strip()
  # zh = "\n".join(zh.split()) #dsds經過相關處理後得到中文的文字
  for s in zh.split():
    out.add(s) # 經過相關處理後得到中文的文字
  return out
 
def extract_file(path):
  result = set()
  try:
    f = open(path) # 開啟檔案
    lines = f.readlines()
    for line in lines:
      string = translate(line)
      if string:
        result.update(string)
  except Exception as e:
    pass
  return result
 
 
def extract(path):
  result = set()
  files = os.listdir(path)
  for file in files:
    if not file.startswith("."):
      if not os.path.isdir(path + "/" + file): # 判斷是否是資料夾，不是資料夾才打開ssgsg判斷是否是資料夾，不是資料夾才打開
        sub_file = extract_file(path + "/" + file)
        if sub_file:
          result.update(sub_file)
      else:
        print file
        child = extract(path + "/" + file)
        if child:
          result.update(child)
  return result
 
 
if __name__ == '__main__':
  path = "/Users/common"
  result = extract(path)
  res_file = open("result.txt","w")
  for s in result:
    res_file.write(s + "\n")

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

python實現遞迴查詢某個路徑下所有檔案中的中文字元

本文例項為大家分享了python實現遞迴查詢某個路徑下所有檔案中的中文字元，供大家參考，具體內容如下

python遞迴下載資料夾下所有檔案

最近想備份網站，但是php下載檔案的大小是有大小限制的，而我也懶得裝ftp再下載了，就想著暫時弄個二級域名站，然後用python(python3)的requests庫直接下載網站根目錄下的所有檔案以及資料夾。（0-0就是這麼任性）

Java File 利用遞迴得到資料夾下所有檔案

技術標籤：Io流java程式人生後端windows大資料 Java File 利用遞迴得到資料夾下所有檔案

【測試開發】十二、介面測試-實現介面列表功能-遞迴查詢子節點下的介面

基於 springboot+vue 的測試平臺開發繼續更新。模組樹節點的開發暫告一段落，現在開發右邊介面相關的部分，今天先完成列表的功能。

MySQL通過自定義函式實現遞迴查詢父級ID或者子級ID

背景: 在MySQL中如果是有限的層次，比如我們事先如果可以確定這個樹的最大深度,那麼所有節點為根的樹的深度均不會超過樹的最大深度，則我們可以直接通過left join來實現。

Python 實現遞迴法解決迷宮問題的示例程式碼

迷宮問題問題描述：迷宮可用方陣 [m,n] 表示，0 表示可通過，1 表示不能通過。若要求左上角 (0,0) 進入，設計演算法尋求一條能從右下角 (m-1,n-1) 出去的路徑。

JavaFTP遞迴查詢指定目錄下的所有目錄和檔案

需要在前端展示ftp伺服器中的目錄結構，實現使用者對ftp目錄實時查詢和其他檔案操作。

MySQL中實現遞迴查詢

對於資料庫中的樹形結構資料，如部門表，有時候，我們需要知道某部門的所有下屬部分或者某部分的所有上級部門，這時候就需要用到mysql的遞迴查詢。

mysql實現遞迴查詢

mysql 遞迴樹查詢表名: tree 表結構(主要欄位): id, name, parent_id 新建一個mysql 函式

使用mybatis實現遞迴查詢

由於部門的層級不可控，因此如果我想要獲取所有部門的完整json的話，就要採用遞迴呼叫，這裡的遞迴呼叫我們可以利用MyBatis的ResultMap中的collection實現，核心程式碼如下：

資料庫實現遞迴查詢，獲取節點的所有子孫節點

with cte as (select orgid from fx_org where orgid =\'138\' union all select fx_org.orgid from fx_orginner join cte on fx_org.parentid = cte.orgid )

Java 遞迴獲取路徑下所有檔案

/** * 遞迴獲取路徑下所有檔案 * * @param path要獲取的路徑 * @param depth初始深度 * @param maxDepth 最大遞迴深度

Postgresql實現遞迴查詢字典並轉JSON

現在有一張字典表，有二級、三級字典項，需要遞迴查詢並轉換成JSON物件。字典資料情況如下：

遞迴與偽遞迴區別，Python 實現遞迴與尾遞迴

遞迴函式在函式內部，可以呼叫其他函式。如果一個函式在內部呼叫自身本身，這個函式就是遞迴函

初識TypeScript：查詢指定路徑下的檔案按型別生成json

如果開發過node.js的話應該對js（javascript）非常熟悉，TypeScript（以下簡稱ts）是js的超集。

python如何遍歷指定路徑下所有檔案（按按照時間區間檢索）

需求要求查詢資料夾裡某個日期區間內的word文件，全部word的名稱和路徑列出來，比如 7月5號到7月31號 D盤下的所有word文件。

mysql 遞迴查詢選單節點的所有子節點的方法

背景專案中遇到一個需求，要求查處選單節點的所有節點，在網上查了一下，大多數的方法用到了儲存過程，由於線上環境不能隨便新增儲存過程，

[Python]爬蟲獲取知乎某個問題下所有圖片並去除水印

獲取URL 進入某個知乎問題的主頁下，按F12開啟開發者工具後檢視network面板。 network面板可以檢視頁面向伺服器請求的資源、資源的大小、載入資源花費的時間以及哪些資源載入失敗等資訊。還可以檢視HTTP的請求頭，

python批量上傳本地資料夾下所有檔案 - 工作筆記

from urllib import parse#用於encode url中的folder引數 import requests#使用者requests.post 提交post請求

【Linux】linux替換目錄下所有檔案中的某字串

摘自：https://blog.csdn.net/smilefxx/article/details/84061606 linux替換目錄下所有檔案中的某字串比如，要將目錄/modules下面所有檔案中的zhangsan都修改成lisi，這樣做：