1. 程式人生 > >pandas.cut()用法

pandas.cut()用法

pandas.cut

pandas.cut(xbinsright=Truelabels=Noneretbins=Falseprecision=3,include_lowest=False)

bins  [bɪn]  n. 箱子;素材屜;工具屜(bin的複數形式)

v. 把…放入箱子中(bin的三單形式)

(計算機) 箱、爾資訊網路 (bell information network)、進位制、進數

pecision  [prɪ'sɪʒ(ə)n]  n. 精度,[數] 精密度;精確

adj. 精密的,精確的

indices  ['ɪndɪsiːz]  n. 指數;目錄(index的複數)

                                     (計算機) 索引、指數

返回半開箱的索引,每個x值都屬於該值。

array [ə'reɪ] n. 陣列,陣列;排列,列陣;大批,一系列;衣服

vt. 排列,部署;打扮  

(計算機) 陣列eg:

Designing optimum array processing toolbox based on MATLAB.

實現了基於MATLAB的最優陣列處理工具包。

(計算機) 佇列eg:

Special attention was given to the data array packaging,transmission, lost package recovering and data flow control. These assured thereal-time transmission in LAN, for which the time delay of video transfer wascontrolled below 0.1s.3.

重點解決了視訊資料佇列的拆包、傳輸與丟包恢復及流量控制問題,保證了局域網環境中的實時傳輸,時延小於0.1秒。

dimensional  [daɪ'mɛnʃənl]  adj. 空間的;尺寸的

                                               (計算機) 尺寸的、維的

x:類似陣列排列

         輸入要binned的陣列。 它必須是一維的。

scalar  ['skeɪlə]  adj. 標量的;數量的;梯狀的,分等級的

n. [數] 標量;[數] 數量

(計算機) 影象縮放 - 引用次數:2

In the third important part,video scalar and gamma correcting are needed before displaying in the TFT-LCD.

顯示部分,研究了影象縮放,伽瑪校正,以及模擬屏的通用介面程式。

(計算機) 純量、純量的

interval  ['ɪntəv(ə)l]  n. 間隔;間距;幕間休息

                                     (計算機) 時距、間隔、間歇

intervalIndex  區間索引

extended  [ɪk'stendɪd; ek-]  adj. 延伸的;擴大的;長期的;廣大的

v. 延長;擴充(extend的過去分詞)

(計算機) 擴充套件、延伸、擴充

niform  ['juːnɪfɔːm]  adj. 統一的;一致的;相同的;均衡的;始終如一的

n. 制服

vt. 使穿制服;使成一樣

extension  [ɪk'stenʃ(ə)n; ek-]  n. 延長;延期;擴大;伸展;電話分機

bins : int,標量序列,或區間索引

         如果bins取一個int整數,它定義了在x範圍內的等寬bins的數量。然而,在這種情況下,x的範圍在每一邊擴充套件了0.1%,包含了x的最小值或最大值。如果bins是一個序列,它就定義了bins的邊界即寬度,允許不均勻的bins寬度。在這種情況下沒有擴充套件x的範圍。

right:boolean 值,可選

         表明bins是否包括最右邊緣。 如果right == True(預設值),則bin[1,2,3,4]表示(1,2],(2,3],(3,4]。

labels :陣列或布林,預設無

indicators ['ɪndə,ketɚ] n. 指示器(indicator的複數);指示燈

                                     (計算機) 指示劑、指標

         用作結果bins的標籤。 必須與得到的bins的長度相同。 如果為False,則只返回bin的整數指示符。

retbins:boolean值,可選

         是否返回bins? 如果bins是給定的一個標量,可以使用它。(自己:retbins就是return bins的縮寫,即這個引數是表示是否返回bins引數的內容,true就返回,false就不返回

precision :int,可選的

         儲存和顯示bins標籤的精度

include_lowest :bool,可選

interval ['ɪntəv(ə)l] n. 間隔;間距;幕間休息

inclusive [ɪn'kluːsɪv] adj. 包括的,包含的

                                     (計算機)可兼的、包含

left-inclusive interval 左閉合區間

         第一個間隔是否應該是左邊的。

Returns

out:分類或系列或整數陣列,如果標籤為False

categorical  [kætɪ'gɒrɪk(ə)l]  dj. 絕對的(名詞categoricalness,副詞categorically,異體字categoric);直接了當的;無條件的;屬於某一範疇的

                                                             (計算機) 分類屬性 - 引用次數:25

One airborne radar databasewith a large scale contains massive continuous attributes and categoricalattributes.

某機載雷達資料庫中包含大量連續屬性和分類屬性,且資料庫規模龐大。

         返回型別(分類或系列)取決於輸入:一系列型別類別,如果輸入是系列其他類別。當分類資料被返回時,倉表示為類別。

bins:浮子的陣列

         僅當retbins為True時返回。

筆記

剪下函式可用於從連續變數到分類變數。 例如,切割可以將年齡轉換成年齡範圍。

結果中的任何NA值都為NA。 在結果的Categorical物件中,超出範圍的值將為NA

例子

>>>pd.cut(np.array([.2, 1.4, 2.5, 6.2, 9.7, 2.1]), 3, retbins=True)

([(0.191,3.367], (0.191, 3.367], (0.191, 3.367], (3.367, 6.533],

  (6.533, 9.7], (0.191, 3.367]]

Categories(3, object): [(0.191, 3.367] < (3.367, 6.533] < (6.533, 9.7]],

array([0.1905    ,  3.36666667, 6.53333333,  9.7       ]))

>>>pd.cut(np.array([.2, 1.4, 2.5, 6.2, 9.7, 2.1]), 3,

          labels=["good","medium","bad"])

[good,good, good, medium, bad, good]

Categories(3, object): [good < medium < bad]

>>>pd.cut(np.ones(5), 4, labels=False)

array([1,1, 1, 1, 1], dtype=int64)