python 兩種多執行緒比較，有時多執行緒有可能變成累贅

阿新 • • 發佈：2020-12-13

首先我是為了把這56w左右的資料清洗

變成這樣：

從一個txt清洗，寫到另一個txt中。原本是幾千條資料，一直用的普通的，速度還挺快，今天想清洗這56w資料，就想到了多執行緒。

第一種方法：

def huoqu(file):
    ts_queue = Queue(10000)
    with open(file, 'r')as f:
        t = f.read()
        IP = t.split('\n')
        for i in IP:
            ts_queue.put(i)
        return ts_queue
def qingxi(ts_queue):
     
while not ts_queue.empty():
        i = ts_queue.get()
        port_1 = re.findall(r"W12.*", i)
        port_1 = ''.join(port_1)
        try:
            t = zidian.zi_dian()
            port = str(t[port_1])
        except:
            port = '9999'
        port_2 = re.findall(r"/common.*", i)
        port_2  
= ''.join(port_2)
        IP = i.replace(port_2, port)
        with open('IP3.txt', 'a+')as g:
            g.write(IP)
            g.write('\n')

with open('IP.txt','r')as f:
    t= f.read()
    IP = t.split('\n')
    heji = []
    for i in IP:
        port_1 = re.findall(r"W12.*", i)
        port_1  
= ''.join(port_1)
        try:
            t = zidian.zi_dian()
            port = str(t[port_1])
        except:
            port = '9999'
        port_2 = re.findall(r"/common.*", i)
        port_2 = ''.join(port_2)
        IP = i.replace(port_2, port)
        heji.append(IP)
        #print(IP)
    heji.pop()
    for i in heji:
        with open('IP2.txt', 'a+')as g:
            g.write(i)
            g.write('\n')


if __name__ == "__main__":

    start = datetime.datetime.now().replace(microsecond=0)
    print('開始————————讀取列表：')
    t = 'IP.txt'
    s = huoqu(t)
    threads = []
    for i in range(100):
        t = threading.Thread(target=qingxi, name='th-' + str(i), kwargs={'ts_queue': s})
        threads.append(t)
    for t in threads:
        t.start()
    for t in threads:
        t.join()
    end = datetime.datetime.now().replace(microsecond=0)
    print('刪除耗時：' + str(end - start))

這是平常我最喜歡用的多執行緒方法，非阻塞式得，速度最快的，但今天卡死了，不動了，原因

return ts_queue      
需要新增56w的資料加入，來進行執行緒運作，當時不行了。
不新增執行緒還能運作，就是很慢，這個完全不工作了、

想到了換下一種，並且運用了自己帶函式  map（）  來提高效率。

：

def square(x):
    port_1 = re.findall(r"W12.*", x)
    port_1 = ''.join(port_1)
    try:
        t = zidian.zi_dian()
        port = str(t[port_1])
    except:
        port = '9999'
    port_2 = re.findall(r"/common.*", x)
    port_2 = ''.join(port_2)
    IP = x.replace(port_2, port)
    return IP
def main():
    with open('IP.txt', 'r')as f:
        t = f.read()
        IP = t.split('\n')
        IP.pop()
        res = map(square, IP)
        t_list = []
        for ip_port in res:
            t = threading.Thread(target=is_enable, args=(ip_port,))
            t.start()
            t_list.append(t)
        for t in t_list:
            t.join()


def is_enable(ip_port):
    with open('IP3.txt', 'a+')as g:
        g.write(ip_port)
        g.write('\n')

if __name__ == '__main__':
    start = datetime.datetime.now().replace(microsecond=0)
    main()
    end = datetime.datetime.now().replace(microsecond=0)
    print('刪除耗時：' + str(end - start))
    #刪除耗時：0:05:14

並換上了另一種快速的多執行緒，清洗用內建函式完成，寫入檔案用多執行緒，但居然用了5分多種，多了幾個for迴圈，大大拉低了速度，這就說明這個完全沒必要用多執行緒，還拉低了速度。

這時候看下不用多執行緒的。：

def square(x):
    port_1 = re.findall(r"W12.*", x)
    port_1 = ''.join(port_1)
    try:
        t = zidian.zi_dian()
        port = str(t[port_1])
    except:
        port = '9999'
    port_2 = re.findall(r"/common.*", x)
    port_2 = ''.join(port_2)
    IP = x.replace(port_2, port)
    return IP
start = datetime.datetime.now().replace(microsecond=0)
with open('IP.txt', 'r')as f:
    t = f.read()
    IP = t.split('\n')
    IP.pop()
    res = map(square, IP)
    for i in res:
        with open('IP3.txt', 'a+')as g:
            g.write(i)
            g.write('\n')
    end = datetime.datetime.now().replace(microsecond=0)
    print('刪除耗時：' + str(end - start))
    # 刪除耗時：0:03:52

明顯快多了，只用4分鐘左右，顯然for 迴圈在56w資料面前，大大拉低了速度，耗費了時間，所以兩種多執行緒個有優點，當資料過大，寫入檔案不如不用多執行緒。

要想加快，可以把列表分成幾個，單獨給每個列表寫入檔案，但順序會發生變化，更加吃電腦配置了。

python 兩種多執行緒比較，有時多執行緒有可能變成累贅

首先我是為了把這56w左右的資料清洗變成這樣：從一個txt清洗，寫到另一個txt中。原本是幾千條資料，一直用的普通的，速度還挺快，今天想清洗這56w資料，就想到了多執行緒。

python多執行緒程式設計，獲取各個執行緒返回值及相關問題

技術標籤：pythonpython多執行緒thread併發程式設計本文介紹兩種python多執行緒程式設計方式：multiprocessing.Process() andmultiprocessing.Pool().

javascript——定義函式的兩種方式以及使用的時候傳入多個引數的情況，arguments和...rest

技術標籤：# javascriptjavascript 1.第一種方式定義函式 function abs(x) { if (x >= 0) return x;

WebService的兩種方式SOAP和REST，之間的區別與優缺點

什麼是SOAP? SOAP (Simple Object Access Protocol) 顧名思義，是一個嚴格定義的資訊交換協議，用於在Web Service中把遠端呼叫和返回封裝成機器可讀的格式化資料。事實上SOAP資料使用XML資料格式，定義了一整套複雜的

python 兩種方法修改檔案的建立時間、修改時間、訪問時間

突如其來想知道一下 python 如何修改檔案的屬性（建立、修改、訪問時間），於是就去網上搜集了可行方案，也就有了這篇部落格

python 兩種方法刪除空資料夾

第一種方法： import os def delete_gap_dir(dir): if os.path.isdir(dir): for d in os.listdir(dir): #print(\'1\',os.path.join(dir,d))

python兩種註釋用法的示例

註釋　　標註解釋，目的是幫助讀者理解的文字　　也就是說，註釋首先是文字，其二是說明，其三是思路，其四是例子

redis中RDB和AOF兩種持久化方式的比較

1、RDB持久化機制就是我們俗稱的備份，他可以在定期內對資料進行備份，將Redis伺服器中的資料持久化到硬碟中；

python兩種獲取剪貼簿內容的方法

第一種 import win32clipboard import time #速度快容易出錯 class niubi(): def lihai(self): while True:

react之兩種定義元件的方式，通過方法定義和通過類繼承React.Component來定義

技術標籤：# react需理解reactjsjavascripthtml5 程式碼 <!DOCTYPE html> <html lang="en">

Epic 《堡壘之夜》兩年收入超 90 億美元，更多財務資料曝光

5 月 4 日訊息Epic 與蘋果的訴訟案開庭在即，今日 Epic 向法院公開了一份財務報表，展現了一些關鍵資料。財報顯示，遊戲《堡壘之夜》自 2018 年發售起，全年收入達 54.77 億美元，而 2019 年的收入也達到了 37 億美

兩個大整數的比較，包括超過16位精度的數字（js）

JS整數的精度是Math.pow(2,53),大於 9007199254740992 (16位數)的可能會丟失精度。所以對於大數字加減和比較，可以將數字拆分成多個15位數字，進行加減或比較。

uniapp : 仿釘釘考勤統計頁面的日曆元件，通過日曆展示每日考勤打卡情況，支援在日曆上打兩種不同型別的點，大致適配各種解析度

效果圖不帶月份變化事件帶月份變化事件 demo的github地址介紹使用的元件基於uni-calendar,外掛市場地址,元件示例

v-if 和 v-show：兩種 Vue 條件渲染比較分析來自杏鑫登陸

在Vue中，有兩種方法可以有條件地渲染部分應用程式：v-if和v-show。你可能會問，“為什麼我們需要兩種方法？”

Facebook及推特稱搗毀多國網路團體，3500多虛假帳戶被凍結

據報道，Facebook 和 Twitter 週四表示，他們已經在多國搗毀了十多個獲得政治團體支援或具有官方背景的虛假資訊傳播網路，避免其平臺使用者遭到欺騙。

若需要將某個程式反覆執行K遍，且每次執行相互獨立，只是程式大體框架上相同。

技術標籤：大學C語言基礎程式設計c語言若需要將某個程式反覆執行K遍，且每次執行相互獨立，只是程式大體框架上相同。則程式碼如下：

php線上執行學習工具，可以線上執行除錯php程式碼

今天分享一款php線上執行學習工具，可以執行基礎php語法和除錯基礎的php，是新手必備的工具，讓你隨時隨地學習php! 本原始碼在也是一款開源專案，在前人基礎上修改的，新增了一些語法錯誤。

Python 多執行緒，threading模組，建立子執行緒的兩種方式示例

本文例項講述了Python 多執行緒，threading模組，建立子執行緒的兩種方式。分享給大家供大家參考，具體如下：

python: 多執行緒實現的兩種方式及讓多條命令併發執行

一概念介紹 Thread 是threading模組中最重要的類之一，可以使用它來建立執行緒。有兩種方式來建立執行緒：一種是通過繼承Thread類，重寫它的run方法；另一種是建立一個threading.Thread物件，在它的初始化函式（__

併發程式設計（執行緒）——前言理論，開啟執行緒的兩種方式，執行緒物件join方法，同一個程序下的多個執行緒資料共享，執行緒物件及其他方法，守護執行緒，執行緒互斥鎖，GIL全域性直譯器鎖理論

一、執行緒理論計算機相當於大工廠，工廠裡有一個個的車間（程序），有很多人（執行緒）幹不同的事真正幹活的是執行緒--》執行緒是cup排程的最小單位程序是資源分配的最小單位，執行緒是CPU排程的最小單位。每一個程

python 兩種多執行緒比較，有時多執行緒有可能變成累贅

相關推薦