pandas DataFrame高效程式設計方法：根據多列的值做判斷，生成新的列值,其中多列的值是包含多個值的資料型別

阿新 • • 發佈：2018-11-15

一.遇到的問題描述：

我遇到問題的資料比較複雜，下面以比較簡單的資料為例說明問題，所以這些資料的含義是沒有意義的，可以忽略資料的的具體意義。資料如下所示：

import numpy as np
import pandas as pd
data = {'city': [{'Beijing':1, 'Shanghai':2,"lanzhou":7}, {'Guangzhou':3, 'Shenzhen':4},{'Hangzhou':5, 'Chongqing':6}],
       'word': [["Beijing","Shanghai"],["Guangzhou","Hangzhou"],["Chongqing"]],
       'population': [2100, 2300, 1000]}
frame = pd.DataFrame(data, columns = ['word', 'city', 'population'])
frame

我想要統計word的每行資料中每個元素在city的對應行中是否存在，如果存在將對應的字典裡面的鍵值賦給它，並生成一個新的字典。

二.解決方法：

import ast
def get_title_dict(a,b):
    title_cut_dict={}
    for i in a:
        if i in b:
            title_cut_dict[i]=b[i]
    return title_cut_dict
frame["test"]=frame.apply(lambda x: get_title_dict(x.word, x.city), axis = 1)
frame

結果如下所示：

這個問題還有另外一種處理方式，就是先遍歷frame的每行，然後遍歷該行中的word，然後遍歷city，這樣就會有三層迴圈，速度非常慢。

三.參考資料：

https://blog.csdn.net/qq_30565883/article/details/79464266

pandas DataFrame高效程式設計方法：根據多列的值做判斷，生成新的列值,其中多列的值是包含多個值的資料型別

一.遇到的問題描述：我遇到問題的資料比較複雜，下面以比較簡單的資料為例說明問題，所以這些資料的含義是沒有意義的，可以忽略資料的的具體意義。資料如下所示： import numpy as np import pandas as pd data = {'city': [{'Beijing':1

pandas DataFrame 根據多列的值做判斷，生成新的列值

環境：Python3.6.4 + pandas 0.22主要是DataFrame.apply函式的應用，如果設定axis引數為1則每次函式每次會取出DataFrame的一行來做處理，如果axis為1則每次取一列。如程式碼所示，判斷如果城市名中含有ing欄位且年份為2016，則

Pandas DataFrame的pop()方法

pop方法 pop方法可以將所選列從原資料塊中彈出，原資料塊不再保留該列。改變某一列的位置如：先刪除gender列，然後在原表data中第0列插入被刪掉的列。 data.insert(0, '性別', data.pop('gender')) #pop返回刪除的列，插入到第

pandas DataFrame的修改方法

pandas DataFrame的增刪查改總結系列文章：對於DataFrame的修改操作其實有很多，不單單是某個部分的值的修改，還有一些索引的修改、列名的修改，型別修改等等。我們僅選取部分進行介紹。一、值的修改 DataFrame的修改方法，其實前面介紹loc方法的時候介紹了一些。 1、 loc方法修改

比Switch case 更高效的方法：字典（Dictionary） + 委託（delegate）

Hello,我是KitStar 以下文章整理的不對。還請見諒以下程式碼書寫於Unity3D中。眾所周知，在C#中。一條switch語句允許測試一個變數在等於多個值的時的情況

一些基礎的高效程式設計方法

儘量靜態化：如果一個方法能被靜態，那就宣告它為靜態的，速度可提高1/4，甚至我測試的時候，這個提高了近三倍。當然了，這個測試方法需要在十萬級以上次執行，效果才明顯。其實靜態方法和非靜態方法的效率主要區別在記憶體：靜態方法在程式開始時生成記憶體,例項方法在程式執行中生成記憶體，所以靜態方法可以直接呼叫,例項方

lsof/netstat命令的一個重要作用：根據進程查端口，根據端口查進程

netstat命令進程 at命令 gre 我們實現 sta -a rep 我們知道，根據ps -aux | grep xxx就是很快實現進程名和進程號的互查，所以我們只說進程號pid就行。如下示例中，進程pid常駐。 1. 根據進程pid查端口：

產品經理：根據使用者手機殼變換顏色，程式設計師：別說了，拔劍吧！

在錯綜複雜的團隊關係網中，存在著兩種關係十分微妙的群體，那就是——產品汪和程式猿。任何一個公司裡都有因為工作而糾纏不休、愛恨交織的一張大網，網際網路公司亦不例外。這不，產品汪和程式猿們又火了，引來一大波的吃瓜群眾！那麼究竟是怎麼回事呢？據知情人爆料，皆因產品經理給研發提出了一個需求：要求 Ap

小工具：根據剪下板中的url生成markdown程式碼

參考部落格：爬CSDN部落格 - CSDN部落格在部落格寫作中，我經常遇到這樣一個問題：當我需要掛出一些網站連結，比如參考部落格或者OJ連結的時候，需要用這樣 [爬CSDN部落格](https://blog.csdn.net/qq_17172105/article/

input搜尋框：根據歷史記錄自動填充後，去除預設黃色背景

如果是純色背景，直接通過box-shadow覆蓋即可： input:-webkit-autofill { color: #333!important; -webkit-text-fill-color: #333; box-shadow: 0 0 0 1000px #eaeaea inset

課堂練習1：定義一個交通工具（Vehicle）類，其中有：屬性：速度（speed）,體積（size）方法：移動（move（）），設定速度（setSpeed(int speed)）,設定體積

定義一個交通工具（Vehicle）類，其中有：屬性：速度（speed）,體積（size）方法：移動（move（）），設定速度（setSpeed(int speed)）,設定體積（setSize(int size)）加速speedUp(),減速speedDown（）等在測

iOS 給測試人員測試手機APP的四種方法：真機執行（略），打ipa包，（testFlighe）郵件,蒲公英（一）打ipa包

APP上線前測試，無外乎一：用資料線真機除錯（以前需要下載真機除錯證書）二：打.ipa包給測試人員（上限100人） 2.1 打包APP的.ipa 包給測試人員之前，如果沒有新增裝置的UDID號，先進入蘋果開發者中心（添加了直接跳到2.6） 2.2點

最簡單方法：windows平臺下python安裝opencv，即實現import cv2功能

之前用的下面舊方法裝好了opencv，重灌系統後按照原來的方法重灌了下opencv，結果一直報錯： ImportError: Module use of python27.dll conflicts

輸入一個數據n，計算斐波那契數列(Fibonacci)的第n個值 1 1 2 3 5 8 13 21 34 規律：一個數等於前兩個數之和。

import java.util.Scanner; /** * 輸入一個數據n，計算斐波那契數列(Fibonacci)的第n個值 1 1 2 3 5 8 13 21 34 規律：一個數等於前兩個數之和 * 計算斐波那契數列(Fibonacci)的第n個值. */ public cla

演算法優化：最大m個子段和，問題規模從1個子段和擴充套件到m個，動態規劃

最大m個子段和，問題規模從1個子段和擴充套件到m個，動態規劃問題規模由2個決定，一是子段數m,二是元素個數n,準確的說是最後一個子段終止的標號 b(i,j)定義為：前j個元素中有i個子段，且第i個子段包含j,i個子段和為b(i,j) 那麼原問題的最優解為max{b(m,j)},m&

輸入一個數據n，計算斐波那契數列(Fibonacci)的第n個值 1 1 2 3 5 8 13 21 34 規律：一個數等於前兩個數之和。

import java.util.Scanner; /** * 輸入一個數據n，計算斐波那契數列(Fibonacci)的第n個值 1 1 2 3 5 8 13 21 34 規律：一個數等於前兩個數之和 * 計算斐波那契數列(Fibonacci)的第n個值.

mybatis中傳入基本型別引數，傳入多個基本資料型別

mybatis3.2.6+spring4.0.2 關於傳入基本引數型別以及多個基本型別引數的問題最近再練習框架，找到了一點心得分享出來，不對之處歡迎提出共勉1 引數型別string 一個引數方法：User getUserByName(String username);map

ThinkPHP5 資源巢狀分組路由配置方法(可以根據需要實現多層巢狀,注意：資源巢狀分組路由配置順序依次是巢狀層次遞減)

use think\Route; //資源巢狀分組路由配置方法(可以根據需要實現多層巢狀,注意：分組路由配置順序依次是巢狀層次遞減): // 更改巢狀資源路由blogs資源的資源變數名為blog_id //從表路由(分組路由配置順序必須是從表路由優先配置，否則從表路由一

Eval綁定方法：多條件綁定：

label 通過 ron 運算長度 lac stat col eval ASP.NET邦定數據“<%#Eval("Sex")%>”運用三元運算符： <%#(Eval("Sex", "{0}") == "01") ? "男" : "女"%>

CSS響應式：根據分辨路加載不同CSS的幾個方法，親測可用

響應 col 但是 max-width width media 總結屏幕 link 有時候你需要把同一個頁面在手機和pc同時打開，其中有一個辦法就是判斷不同分辨路加載不同的css 小編總結了幾種分別加載css的方法： 1.比較復雜的使用js判斷加載不同css （親

pandas DataFrame高效程式設計方法： 根據多列的值做判斷，生成新的列值,其中多列的值是包含多個值的資料型別

一.遇到的問題描述：

二.解決方法：

三.參考資料：

相關推薦

pandas DataFrame高效程式設計方法：根據多列的值做判斷，生成新的列值,其中多列的值是包含多個值的資料型別