【概率論與數理統計】小結2 - 隨機變量概述
註:對隨機變量及其取值規律的研究是概率論的核心內容。在上一個小結中,總結了隨機變量的概念以及隨機變量與事件的聯系。這個小結會更加深入的討論隨機變量。
隨機變量與事件
隨機變量的本質是一種函數(映射關系),在古典概率模型中,“事件和事件的概率”是核心概念;但是在現代概率論中,“隨機變量及其取值規律”是核心概念。
隨機變量與事件的聯系與區別
小結1中對這兩個概念的聯系進行了非常詳細的描述。隨機變量實際上只是事件的另一種表達方式,這種表達方式更加形式化和符號化,也更加便於理解以及進行邏輯運算。不同的事件,其實就是隨機變量不同取值的組合。在陳希孺的書中,舉了一個很好的例子來說明兩者之間的差別:
對於隨機試驗,我們所關心的往往是與所研究的特定問題有關的某個或某些量,而這些量就是隨機變量。當然,有時我們所關心的是某個或某些特定的隨機事件。例如,在特定一群人中,年收入在萬元以上的高收入者,以及年收入在3000元以下的低收入者,各自的比率如何?這看上去像是兩個孤立的事件。可是,若我們引入一個隨機變量X:
X = 隨機抽出一個人其年收入,
則X是我們關心的隨機變量。上述兩個事件可分別表示為{X > 10000}或{X < 3000}。這就看出:隨機事件這個概念實際上包容在隨機變量這個更廣的概念之內。也可以說,隨機事件是從靜態的觀點來研究隨機現象,而隨機變量則是一種動態的觀點,一如數學分析中的常量與變量的區分那樣,變量概念是高等數學有別於初等數學的基礎概念。同樣,概率論能從計算一些孤立事件的概率發展為一個更高的理論體系,其基本概念就是隨機變量。
一下子引用了一大段話,這段話非常清楚的解釋了隨機變量與事件的區別:就像變量與常量之間的差別那樣,這樣的差別比起我自己看到的要大得多。做這樣的比較也有利於自己更好的理解“隨機變量”這個多少有點抽象的概念。
隨機變量的分類
隨機變量從其可能取的值全體的性質可以分為兩大類:離散型隨機變量和連續型隨機變量。
離散型隨機變量
離散型隨機變量的取值在整個實數軸上是間隔的,要麽只有有限個取值,要麽是無限可數的。
圖1:離散型隨機變量的概率質量分布
常見的離散型隨機變量包括以下幾種:
- 0-1分布(也叫兩點分布或伯努利分布)
- 二項分布
- 幾何分布
- 泊松分布
- 超幾何分布
連續型隨機變量
連續型隨機變量的取值要麽包括整個實數集(-∞, +∞),要麽在一個區間內連續,總之這類隨機變量的可能取值要比離散型隨機變量的取值多得多,它們的個數是無限不可數的。
常見的連續型隨機變量包括以下幾種:
- 均勻分布
- 指數分布
- 正態分布
隨機變量的基本性質
隨機變量最主要的性質是其所有可能取到的這些值的取值規律,即取到的概率大小。如果我們把一個隨機變量的所有可能的取值的規律都研究透徹了,那麽這個隨機變量也就研究透徹了。研究隨機變量的方法主要有兩類:一類是大而全的方法,這類方法可以詳細描述所有可能取值的概率,例如累積分布函數和概率密度函數就是這類方法;另一類是找到該隨機變量的一些特征或是代表值,例如隨機變量的方差或期望等數字特征就是這類方法。見下表:
縮寫 | 全拼 | 中文名 | 解釋 |
CDF | Cumulative Distribution Function | 累計分布函數 | |
Probability Density Function | 概率密度分布函數 | 連續型隨機變量在各點的取值規律 | |
PMF | Probability Mass Function | 概率質量分布 | 離散隨機變量在各特定取值上的概率 |
RVS | Random Variate Sample | 隨機變量的樣本 | 從一個給定分布取樣 |
PPF | Percentile Point Function | 百分位數點函數 | CDF的反函數 |
IQR | Inter Quartile Range | 四分位數間距 | 25%分位數與75%分位數之差 |
SD | Standard Error | 標準差 | 用於描述隨機變量取值的集中程度 |
SEM | Standard Error of the Mean | 樣本均值的估計標準誤差,簡稱平均值標準誤差 | |
CI | Confidence Interval | 置信區間 |
表1:常見的隨機變量的性質
概率質量函數vs概率密度函數 概率質量函數和概率密度函數不同之處在於:概率質量函數是對離散隨機變量定義的,本身代表該值的概率;概率密度函數是對連續隨機變量定義的,本身不是概率,只有對連續隨機變量的概率密度函數在某區間內進行積分後才是概率。
References
《概率論與數量統計》,陳希孺,中國科學技術大學出版社,2009年2月第一版
中國大學MOOC:浙江大學,概率論與數理統計
https://en.wikipedia.org/wiki/Probability_distribution
【概率論與數理統計】小結2 - 隨機變量概述