概率論與數理統計筆記 第二章 隨機變量及其概率分布
概率論與數理統計筆記 第二章 隨機變量及其概率分布
概率論與數理統計筆記(計算機專業) 作者: CATPUB 新浪微博:@catpub
課程:中國大學MOOC浙江大學概率論與數理統計
部分平臺可能無法顯示公式,若公式顯示不正常可以前往CSDN或作業部落進行查看
第一章:https://www.zybuluo.com/catscarf/note/971426
第二章:https://www.zybuluo.com/catscarf/note/972996
第9講 隨機變量
- 定義
- 隨機變量 $X(e)$,$X$ 是 $S\to R$ 的函數,$e$ 是樣本點
- 自變量 $e\subset S$
- 隨機事件 $A={e|X(e)=I}={X=I}$
如多次投擲骰子,隨機事件 {6點在第3次出現} 可以記作 ${X=3}$,$X$ 是隨機變量
隨機變量
- 離散型隨機變量,值的集合的基數小於等於阿列夫零(離散數學概念)
連續型隨機變量
分布律
$X$ $x_1$ $x_2$ $...$ $x_k$ $...$ $P$ $p_1$ $p_2$ $...$ $p_k$ $...$ $$P(X=x_k)=p_k (k=1,2,...)$$
幾何分布 Geometric Distribution
多次投擲骰子,$6?$ 點第一次出現時投擲的次數
$X$ $1$ $2$ $3$ $...$ $k$ $...$ $P$ $$\frac{1}{6}$$ $$\frac{5}{6}\cdot\frac{1}{6}$$ $$(\frac{5}{6})^2 \cdot\frac{1}{6}$$ $...$ $$(\frac{5}{6})^{k-1} \cdot\frac{1}{6}$$ $$...$$ ?
第10講 離散型隨機變量
$0\text{-}1$分布(兩點分布)
$$P(X=k)=p^k(1-p)^{n-k}$$
$X$ $0$ $1$ $P$ $1-p$ $1-p$ ?
若X服從兩點分布,則單次試驗稱為伯努利(Bernoulli)試驗
0
記為$X\sim 0\text{-}1(p)$
也記為 $X\sim B(1,p)?$,$B?$ 是Binomial的意思,兩點分布可以看作Binomial分布的特例
$\sim$ 讀作服從於
二項分布 Binomial Distribution
- $$P(X=k)=C_n^k\cdot P^k\cdot (1-p)^{n-k}$$
- $n$ 重Bernoulli實驗,事件發生次數 $k$ 的統計規律
記為$X\sim B(n,p)$
泊松分布 Poisson Distribution
- $$P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!} (k=0,1,2,...)$$
記為 $X\sim \pi(\lambda)$ 或 $x\sim P(\lambda)$
Poisson Distribution與Binomial Distribution的關系
- 當 $n$ 很大 $p$ 很小的時候
$$C_n^k P^k (1-p)^{n-k}=\frac{\lambda^k e^{-\lambda}}{k!} \lambda=np$$
幾何分布 Geometric Distribution
- $P(X=k)=p(1-p)^{k-1}$
- 記為 $X\sim Geom(p)$
實例:研究段譽多少次施展武功能成功的統計規律
第11講 分布函數
- 定義
- $F_X(x)=P(X\leq x)$
- 離散型的隨機變量分布函數為階梯函數
- 性質
- $P(a<X\leq b)=F(b)-F(a)$
- $P(a<X<b)=F(b-0)-F(a)$
- $P(X=b)=F(b)-F(b-0)$
- $F(x)$ 單調不減
- $F(-\infty)=0,F(+\infty)=1$
- $F(x)$ 右連續
第12講 連續性隨機變量及其概率密度
- 定義
- $$F(x)=\int_{-\infty}^x f(t)dt$$
- $F(x)$ 為連續型隨機變量的分布函數
- $f(t)$ 為連續型隨機變量的概率密度函數
- 若一個隨機變量有概率密度函數則其一定為隨機變量
- 性質
- $$f(x)\leq 0$$
- $$F(+\infty)=1$$
- $$P(x_1<X<x_2)=\int_{x_1}^{x_2}f(t)dt$$
- $$F‘(x)=f(x)$$
- $$f(x)$$ 可以大於1
- 概率密度對 $>,\geq ,<,\leq$ 不敏感,即對端點取值不敏感
第13講 均勻分布和指數分布
- 均勻分布 Uniform Distribution
- $$f(x)=\frac{1}{b-a} a\leq x<b$$
- $$F(x)=\frac{x-a}{b-a} a\leq x<b$$
- 記為 $X\sim U(a,b)$ 或 $X\sim Unif(a,b)$
- 指數分布 Exponential Distribution
- $$f(x)=\lambda e^{-\lambda x} x>0$$
- $$F(x)=1-e^{-\lambda x} x>0$$
- 記為 $X\sim E(\lambda)$ 或 $X\sim Emp(\lambda)$
- 指數分布具有無記憶性(Memoryless Property)且在連續性隨機變量的分布中,只有指數分布具有無記憶性
- 實例:設旅客等待時間服從指數分布,則已知旅客已經等了20分鐘,求旅客再等5分鐘的概率,和旅客從頭開始等5分鐘的概率相同
- 即 $P(X>25|X>20)=P(X>5)$
- 指數分布常用來表示獨立隨機事件發生的時間間隔,如中文維基百科新條目出現的時間間隔
- 在排隊論中,一個顧客接受服務的時間長短也可以用指數分布來近似
第14講 正態分布
- 正態分布 Normal Distribution
- $$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$
- 記為 $X\sim N(\mu, \sigma^2)$
- 性質
- 關於 $x=\mu$ 對稱
- $$f_{max}=f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$$
- $$limf(x)=0$$
- 參數的性質
- 改變 $\mu$,$f(x)$ 只沿 $x$ 軸評議
- $\sigma$ 越大,$f(x)$ 越矮胖,$\sigma$ 稱為尺度參數
- 實例:身高,體重,測量誤差,多個隨機變量的和
- 標準正態分布
- $$Z\sim N(0,1)$$
- $$\phi(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}$$
- $$\Phi(z)=\int_{-\infty}^z\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt$$
- $\Phi(z)$ 有標準正態分布函數表
- 一般正態分布轉為標準正態分布
- 當 $X\sim N(\mu,\sigma^2)$ 時,$(x-\mu)/\sigma\sim N(0,1)$
- $$F_x(a)=P(x\leq a)=P(\frac{x-\mu}{\sigma}\leq \frac{a-\mu}{\sigma})=\Phi(\frac{a-\mu}{\sigma})$$
- $3\sigma$ 準則
- 當 $x$ 落在 $(-3\sigma,3\sigma)$ 的概率為 $99.73%$
第15講 隨機變量函數的分布
已知 $X$ 的概率分布,已知 $Y=g(x)$,求 $Y$ 的概率分布
- 先給出 $Y$ 的可能分布,再利用等價事件來給出概率分布
- 離散型隨機變量,直接利用分布律求解即可
連續型隨機變量,先利用分布函數找到等價事件,再利用概率密度函數即可
定理
- 若 $Y=g(x)$,$g‘(x)>0$ 或 $g‘(x)<0$
- $$f_Y(y)=f_x(h(y))\cdot |h‘(y)| \alpha<y<\beta$$
- $h(y)$ 是 $g(x)$ 的概率密度函數的反函數
$\alpha$ 和 $\beta$ 是根據 $x$ 與 $y$ 的對應關系求得的
一般的
若 $X\sim N(\mu,\sigma^2)$,$Y=aX+b$,則 $Y\sim (a\mu +b,a^2\sigma^)$
## 作者拓展
- 當前的所有分布
- 二項分布 Binomial Distribution
- 泊松分布 Poisson Distribution
- 幾何分布 Geometric Distribution
- 均勻分布 Uniform Distribution
- 指數分布 Exponential Distribution
- 正態分布 Normal Distribution# 概率論與數理統計筆記 第二章 隨機變量及其概率分布
概率論與數理統計筆記(計算機專業) 作者: CATPUB 新浪微博:@catpub
課程:中國大學MOOC浙江大學概率論與數理統計
部分平臺可能無法顯示公式,若公式顯示不正常可以前往CSDN或作業部落進行查看
第9講 隨機變量
- 定義
- 隨機變量 $X(e)$,$X$ 是 $S\to R$ 的函數,$e$ 是樣本點
- 自變量 $e\subset S$
- 隨機事件 $A={e|X(e)=I}={X=I}$
如多次投擲骰子,隨機事件 {6點在第3次出現} 可以記作 ${X=3}$,$X$ 是隨機變量
隨機變量
- 離散型隨機變量,值的集合的基數小於等於阿列夫零(離散數學概念)
連續型隨機變量
分布律
$X$ $x_1$ $x_2$ $...$ $x_k$ $...$ $P$ $p_1$ $p_2$ $...$ $p_k$ $...$ $$P(X=x_k)=p_k (k=1,2,...)$$
幾何分布 Geometric Distribution
多次投擲骰子,$6?$ 點第一次出現時投擲的次數
$X$ $1$ $2$ $3$ $...$ $k$ $...$ $P$ $$\frac{1}{6}$$ $$\frac{5}{6}\cdot\frac{1}{6}$$ $$(\frac{5}{6})^2 \cdot\frac{1}{6}$$ $...$ $$(\frac{5}{6})^{k-1} \cdot\frac{1}{6}$$ $$...$$ ?
第10講 離散型隨機變量
$0\text{-}1$分布(兩點分布)
$$P(X=k)=p^k(1-p)^{n-k}$$
$X$ $0$ $1$ $P$ $1-p$ $1-p$ ?
若X服從兩點分布,則單次試驗稱為伯努利(Bernoulli)試驗
0
記為$X\sim 0\text{-}1(p)$
也記為 $X\sim B(1,p)?$,$B?$ 是Binomial的意思,兩點分布可以看作Binomial分布的特例
$\sim$ 讀作服從於
二項分布 Binomial Distribution
- $$P(X=k)=C_n^k\cdot P^k\cdot (1-p)^{n-k}$$
- $n$ 重Bernoulli實驗,事件發生次數 $k$ 的統計規律
記為$X\sim B(n,p)$
泊松分布 Poisson Distribution
- $$P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!} (k=0,1,2,...)$$
記為 $X\sim \pi(\lambda)$ 或 $x\sim P(\lambda)$
Poisson Distribution與Binomial Distribution的關系
- 當 $n$ 很大 $p$ 很小的時候
$$C_n^k P^k (1-p)^{n-k}=\frac{\lambda^k e^{-\lambda}}{k!} \lambda=np$$
幾何分布 Geometric Distribution
- $P(X=k)=p(1-p)^{k-1}$
- 記為 $X\sim Geom(p)$
實例:研究段譽多少次施展武功能成功的統計規律
第11講 分布函數
- 定義
- $F_X(x)=P(X\leq x)$
- 離散型的隨機變量分布函數為階梯函數
- 性質
- $P(a<X\leq b)=F(b)-F(a)$
- $P(a<X<b)=F(b-0)-F(a)$
- $P(X=b)=F(b)-F(b-0)$
- $F(x)$ 單調不減
- $F(-\infty)=0,F(+\infty)=1$
- $F(x)$ 右連續
第12講 連續性隨機變量及其概率密度
- 定義
- $$F(x)=\int_{-\infty}^x f(t)dt$$
- $F(x)$ 為連續型隨機變量的分布函數
- $f(t)$ 為連續型隨機變量的概率密度函數
- 若一個隨機變量有概率密度函數則其一定為隨機變量
- 性質
- $$f(x)\leq 0$$
- $$F(+\infty)=1$$
- $$P(x_1<X<x_2)=\int_{x_1}^{x_2}f(t)dt$$
- $$F‘(x)=f(x)$$
- $$f(x)$$ 可以大於1
- 概率密度對 $>,\geq ,<,\leq$ 不敏感,即對端點取值不敏感
第13講 均勻分布和指數分布
- 均勻分布 Uniform Distribution
- $$f(x)=\frac{1}{b-a} a\leq x<b$$
- $$F(x)=\frac{x-a}{b-a} a\leq x<b$$
- 記為 $X\sim U(a,b)$ 或 $X\sim Unif(a,b)$
- 指數分布 Exponential Distribution
- $$f(x)=\lambda e^{-\lambda x} x>0$$
- $$F(x)=1-e^{-\lambda x} x>0$$
- 記為 $X\sim E(\lambda)$ 或 $X\sim Emp(\lambda)$
- 指數分布具有無記憶性(Memoryless Property)且在連續性隨機變量的分布中,只有指數分布具有無記憶性
- 實例:設旅客等待時間服從指數分布,則已知旅客已經等了20分鐘,求旅客再等5分鐘的概率,和旅客從頭開始等5分鐘的概率相同
- 即 $P(X>25|X>20)=P(X>5)$
- 指數分布常用來表示獨立隨機事件發生的時間間隔,如中文維基百科新條目出現的時間間隔
- 在排隊論中,一個顧客接受服務的時間長短也可以用指數分布來近似
第14講 正態分布
- 正態分布 Normal Distribution
- $$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$
- 記為 $X\sim N(\mu, \sigma^2)$
- 性質
- 關於 $x=\mu$ 對稱
- $$f_{max}=f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$$
- $$limf(x)=0$$
- 參數的性質
- 改變 $\mu$,$f(x)$ 只沿 $x$ 軸評議
- $\sigma$ 越大,$f(x)$ 越矮胖,$\sigma$ 稱為尺度參數
- 實例:身高,體重,測量誤差,多個隨機變量的和
- 標準正態分布
- $$Z\sim N(0,1)$$
- $$\phi(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}$$
- $$\Phi(z)=\int_{-\infty}^z\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt$$
- $\Phi(z)$ 有標準正態分布函數表
- 一般正態分布轉為標準正態分布
- 當 $X\sim N(\mu,\sigma^2)$ 時,$(x-\mu)/\sigma\sim N(0,1)$
- $$F_x(a)=P(x\leq a)=P(\frac{x-\mu}{\sigma}\leq \frac{a-\mu}{\sigma})=\Phi(\frac{a-\mu}{\sigma})$$
- $3\sigma$ 準則
- 當 $x$ 落在 $(-3\sigma,3\sigma)$ 的概率為 $99.73%$
第15講 隨機變量函數的分布
已知 $X$ 的概率分布,已知 $Y=g(x)$,求 $Y$ 的概率分布
- 先給出 $Y$ 的可能分布,再利用等價事件來給出概率分布
- 離散型隨機變量,直接利用分布律求解即可
連續型隨機變量,先利用分布函數找到等價事件,再利用概率密度函數即可
定理
- 若 $Y=g(x)$,$g‘(x)>0$ 或 $g‘(x)<0$
- $$f_Y(y)=f_x(h(y))\cdot |h‘(y)| \alpha<y<\beta$$
- $h(y)$ 是 $g(x)$ 的概率密度函數的反函數
$\alpha$ 和 $\beta$ 是根據 $x$ 與 $y$ 的對應關系求得的
一般的
若 $X\sim N(\mu,\sigma^2)$,$Y=aX+b$,則 $Y\sim (a\mu +b,a^2\sigma^)$
## 作者拓展
- 當前的所有分布
- 二項分布 Binomial Distribution
- 泊松分布 Poisson Distribution
- 幾何分布 Geometric Distribution
- 均勻分布 Uniform Distribution
- 指數分布 Exponential Distribution
- 正態分布 Normal Distribution
概率論與數理統計筆記 第二章 隨機變量及其概率分布