事件

  • 事件运算:

  • 交、并、补、对称差

  • 分配律、德摩根律、吸收律
    • 吸收律:比如,$若ABC\subset AB,则P(ABC)\leq P(AB)$
  • 事件关系:互斥(互不相容)、对立、独立、相关
  • 互斥:AB为空集,即P(AB)=0
  • 独立:P(B|A)=P(B),即P(AB)=P(A)P(B)
    • ABC独立=/=A、B、C两两独立
    • 独立和互斥没有关系
  • 相关:这里指线性相关,即$\rho$越靠近1则越线性相关,越靠近0则越不线性相关。
    • 独立与不相关的关系:独立<==>$f(x,y)=f_X(x)f_Y(y)$ **==> ** $E(XY)=E(X)E(Y)$<==>$D(X+Y)=D(X)+D(Y)$<==>$Cov(X,Y)$=0<==>$\rho=0$<==>不相关

概率

  • 频率与概率

  • 加法公式:“加奇减偶”

  • $P(A+B)=P(A)+P(B)-P(AB)$

    • 若A与B互斥,$P(A+B)=P(A)+P(B)$
  • $P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)$

  • 减法(对称差)公式

  • $P(A-B)=P(A)-P(AB)$

  • $若B\subset A,P(A-B)=P(A)-P(B)$

  • $P(A-B)=P(A\bar B)$

条件概率

  • 加法公式:同理,在后面加条件即可。
  • 减法公式:同理。
  • 乘法公式
  • $P(AB)=P(A|B)P(B)$

    • 若A与B独立,$P(AB)=P(A)P(B)$
  • 完备事件组:一个事件可以拆解为多个划分,即由每个因素(划分)都贡献了自己的概率而组成了整个事件

  • 全概率公式:设事件X可以被划分为$A_1、A_2、...、A_n$个因素。可以根据各因素概率、因素发生时事件X的概率,求事件X概率

  • $P(X)=P(X|A_1)P(A_1)+P(X|A_2)P(A_2)+...+P(X|A_n)P(A_n)$

  • 贝叶斯公式:前提同上。可以根据事件X概率、各因素概率、各因素发生的条件概率,求事件X发生时因素的概率

  • $P(A_i|X)=\frac{P(A_iX)}{P(X)}=\frac{P(X|A_i)P(A_i)}{P(X)的全概率展开}$

常见题型

1. 古典概型

  • 基本方法:
  • $P=\frac{符合要求的样本个数}{总样本个数}$
  • 组合法:组合已知的概率,比如$P(AB)=P(A)+P(...)P(...)$
  • 分解法:将事件拆分,比如$P(AB)=P(A\bar B...)$
  • 反证法:先算相反事件,比如$P(A)=1-P(\bar A)=1-P(...)$
  • 排列A:有序,不放回取出,不去重
  • 组合C:无序,不放回取出,要去重
  • 取出问题

  • 放回:不属于排列组合问题。

  • 不放回:属于排列组合问题
    • 不按顺序取出(无序)、按顺序取出(有序)
    • 取出物品完全相同(无序)、取出物品完全不相同(有序)、取出物品完全不相同(综合)
  • 分组分配问题
  • 分组:无序,将n个不同元素按照某些条件分成k组。分为平均分组、不平均分组、和部分平均分组
    • 平均分组:以6本书均分3组为例,均分情况数$C_6^2C_4^2C_2^2$,由于无序,最后要除以重复事件$A_3^3$(即除以均匀分组的全排列)
    • 其余分组同理,但均分情况数不同,除以重复事件需注意==只除均匀分组的全排==。
  • 无限制分配:直接等于分配组数全排列
  • 有限制分配:常规法和隔板法
  • 先分组再分配:分组情况数*分配情况数

2. 几何概型

  • 基本方法:
  • $P=\frac{符合要求的样本长度、面积、体积}{总样本长度、面积、体积}$
  • 组合、分解、反证法等同上

3. 伯努利概型

  • 涉及的事件只有独立重复事件,且事件只有两种可能结果
  • 基本方法
  • 二项公式:n次重复试验中事件A发生k次的概率$P_n(k)=C_n^kp^kq^{n-k},其中q=1-p$

一维随机变量

1. 离散分布函数

  • 定义:$F(x)=P{X\leq x}$
  • 某点处的概率表示:
  • $P{X=a} = F(a)-\lim\limits_{x\to a^-}P{X\lt a}=F(a)-F(a^-)$
  • 结果不一定为0,因为是离散取值,所以并不知道$F(a^-)$是否等于$F(a)$
  • 单侧区间上的概率表示:

  • $P{X\leq a}=F(a)$

  • $\lim\limits_{x\to a^-}P{X\lt x}=F(a^-)$

  • 双侧区间上的概率表示

  • $P{a \lt X\leq b} = F(b)-F(a)$

  • $P{a \lt X\lt b} = F(b^-)-F(a)$
  • F(x)的性质

  • 非负、规范单调不减、右连续,规范性一般用来解不定方程中的参数

2. 离散型分布

  • 分布律表达:图表表示、公式表示
  • 0-1分布:又称伯努利分布,即单次的伯努利实验
  • 期望方差:$E=p,D=p(1-p)$

  • 二项分布:基于伯努利分布,P表示n次实验中,成功k次的概率

  • $P{X=k}=C_n^kp^kq^{n-k},其中q=1-p$

  • 记为$X\sim B(n,p)$
  • 三要素:独立重复n次(即n次伯努利实验)、只有两种结果、成功/失败概率不变
  • 期望方差:$E=np,D=np(1-p)$

  • 几何分布:基于伯努利分布,P表示n次实验中,第一次成功的实验概率

  • $P{X=n}=pq^{n-1},其中q=1-p$
  • 记为$X\sim G(p)$

  • 负二项分布:基于几何分布,P表示n次实验中,第r次成功的实验概率

  • $P{X=n}=C_{n-1}^{r-1}p^rq^{n-r},其中q=1-p$(即第n次实验必定成功,而前n-1次实验需要成功r-1次)
  • r=1时,它就是几何分布

  • 超几何分布:基于几何分布,若N个物品中有M个指定物品,则P表示不放回地抽出n个,抽中指定物品的概率

  • 公式略,记为$X\sim H(N,M,n)$

  • 泊松分布:P表示,单位时间或单位空间内某时间内进行任意次独立实验(不一定重复),成功k次的概率。

  • $P{X=k}=\frac{\lambda^ke^{-\lambda}}{k!},其中\lambda>0$

  • 记为$X\sim P(\lambda)或X\sim \pi(\lambda)$
  • 泊松定理:当n远大于p时,可以近似简化二项分布的计算。
    • 设$np=\lambda(\lambda>0),则\lim\limits_{n\to+\infty}二项分布公式 = 泊松分布公式$
    • 其中$泊松分布k=二项分布中的成功次数k$
  • 当$\lambda\approx20$时,泊松分布->正态分布
  • 期望方差:$E=\lambda,D=\lambda$

3. 密度函数与连续分布函数

  • 密度函数:$f(x)=P{X=x}$

  • 分布函数:变限积分$F(x)=\int_{-\infty}^xf(x)dt$

  • f(x)的性质:非负、规范、连续

  • 某点处的概率表示:一定为0,因为连续取指,所以$F(a^-)=F(a)$,$P{X=a}=0=f(a)$
  • 区间的概率表示:使用积分上下限,略

4. 连续型分布

  • 均匀分布

  • $f(x)=\begin{cases} \frac{1}{b-a},a<x<b \ 0,其他 \ \end{cases} $

  • $F(x)=\begin{cases}0,x<a\ \frac{x-a}{b-a},a\leq x<b \1,x\ge b\end{cases} $
  • 记为$X\sim U(a,b)$
  • 期望方差:$E=\frac{a+b}{2}(中点),D=\frac{(b-a)^2}{12}$

  • 指数分布

  • $f(x)=\begin{cases} \lambda e^{-\lambda x},x>0 \ 0,x\leq 0 \ \end{cases} $

  • $F(x)=\begin{cases} 1-e^{-\lambda x},x>0 \ 0,x\leq 0 \ \end{cases} $
  • 记为$X\sim e(\lambda)$
  • 特性
    • 无记忆性:X取值区间平移t0后的概率不变,$P{X>t_0+T|x>t_0} = P{x>T}$
  • 期望方差:$E=\frac{1}{\lambda},D=\frac{1}{\lambda^2}$

  • 正态分布

  • $f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty$
  • 记为$X\sim N(\mu,\sigma^2)$
  • 特性

    • $\mu表示位置,\sigma表示形状$
    • f(x)图像沿$\mu$对称(一般做题先画图利用对称性解题,解不出来再考虑用公式)
    • 上$\alpha$分位点
    • 可加性:期望加期望、方差加方差,还有带系数的情况($CX\sim C\cdot N(\mu,\sigma^2)=N(C\mu,(C\sigma)^2)$)
    • 泊松积分:$\int_{-\infty}^{+\infty}e^{-\frac{x^2}{A}}dx=\sqrt{A\pi},其中A>0$
    • 标准化:$\frac{X-\mu}{\sigma}\sim N(0,1)$
  • 标准正态分布$\Phi(x)$:

  • $\mu=0,\sigma=1时的F(x),即X\sim N(0,1)$
  • $\Phi(-x)=1-\Phi(x)$

5. 一维随机变量的函数

  • 离散型
  • 求分布律:若Y=g(X),则先算Y的取值范围,再求Y的分布律。
  • 连续型
  • 求密度函数:若Y=g(X),反解得X=h(Y)
    1. $F_Y(y)=P{Y\leq y}=P{g(X)\leq y}$,然后反解X,即等于$P{X\leq h(y)}=F_X(h(y))$
    2. 上面等式两端求导,$f_Y(y)=F_Y'(y)=[F_X(h(y))]'=f_X(h(y))\cdot |h'(y)|$
    3. 注意这里的$|h'(y)|$是绝对值,因为要保证$f_Y(y)$是非负的
    4. 根据Y=g(X)和分段区间限制,求y的取值范围

二维随机变量

1. 离散分布函数

  • $F(x,y)=P{X\leq x,Y\leq y}$
  • F(x,y)的性质:非负、规范、单调不减
  • 规范性:$F(-\infty,-\infty)=0,F(x,-\infty)=0,F(-\infty,y)=0,F(+\infty,+\infty)=1$

2.离散型分布

  • 联合分布律表达:图表表示、公式表示
  • 公式表示:$P{X=x_i,Y=y_i}记为p_{ij}$

3. 联合密度函数与连续分布函数

  • $F(x,y)=\int_{-\infty}^x\int_{-\infty}^yf(x,y)dydx$
  • 性质同一维。
  • 正规性:和离散型一致。

4.连续型分布

  • 二维均匀分布
  • $f(x)=\begin{cases} \frac{1}{S_D},(x,y)\in D \ 0,其他 \ \end{cases} $
  • 记为$X\sim U(D)$
  • “包含定理”:若$(x,y)\sim U(D_{out}),且D_{in}\sub D_{out},则P{(x,y)\in D_{in}}=\frac{S_{D_{in}}}{S_{D_{out}}}=\frac{小面积}{大面积}$
  • 二维正态分布
  • 记为$X\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_1^2,\rho),其中\rho表示X与Y的线性相关程度$
  • 推广:正态分布的线性组合也服从正态分布

5. 边缘分布与条件分布

  • 边缘分布
  • 边缘分布律表示:$P{X,Y=y_i}记为p_{\cdot j},P{X=x_i,Y}记为p_{i\cdot}$
    • 取值分别是沿X相加、沿y相加
  • 边缘密度函数:$f_X(x)=f(x,+\infty)=\int_{-\infty}^{+\infty}f(x,y)\cdot dy$
    • 这里相当于只对f(x,y)的其中一轴进行积分(单侧积分)
  • 边缘分布函数:$F_X(x)=F(x,+\infty)=f(x,+\infty)的积分$
  • 条件分布
  • 条件分布律表示:$P{X=x_i|Y=y_i}=\frac{P{X=x_i,Y=y_i}}{P{Y=y_i}}=\frac{P_{ij}}{P_{\cdot j}}$
  • 条件密度函数:$f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}$
  • 条件分布函数:$F_{X|Y}(x|y)=f_{X|Y}(x|y)的积分$
  • 总结:
  • $f_X(x)=f(x,+\infty)=\frac{f(x,y)}{f_{Y|X}(y|x)}=F_{X|Y}(x|y)的导数$
  • $f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}=F_{X|Y}(x|y)的导数$

6. 二维随机变量的函数

  • 离散型
  • 求分布律:若Z=g(X,Y),则先算X和Y的取值范围,再求Z的分布律。
  • 连续型:若Z=g(X,Y)
  • 求密度函数:
    • $F_Z(z)=P{Z\leq z}=P{g(X,Y)\leq z}$,解一个带限制区域($g(X,Y)\leq z$)的二重积分,注意z的分段点和分段区间。
  • 卷积公式:基于Z=X+Y
    • 由于$f_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)\cdot dy或者\int_{-\infty}^{+\infty}f(x,z-x)\cdot dx$
    • 又因为X、Y独立,所以$f(x,y)=f_X(x)\cdot f_Y(y)$
    • 所以:$f_Z(z)=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)\cdot dy$,记为$f_X*f_Y$
  • 最大值最小值:基于Z=max{X,Y}或Z=min{X,Y}
    • $F_{max}(z)=F_X(z)F_Y(z)$
    • $F_{min}(z)=[1-F_X(z)][1-F_Y(z)]$

期望、方差与协方差

1. 期望

  • 定义:$E(X)=\int_{-\infty}^{+\infty}xf(x)\cdot dx$
  • 若Y=g(X),$E(Y)=\int_{-\infty}^{+\infty}g(x)f(x)\cdot dx$
  • 方差公式逆用:$E(X)=\sqrt{E(X^2)-D(X)}$
  • 常见分布的期望见上。
  • 常见期望公式略

2. 方差

  • 定义1:$D(X)=E{[x-E(X)]^2}$
  • 定义2:$D(X)=E(X^2)-[E(X)]^2$
  • 常见分布的方差见上。
  • 常见方差公式略

3. 切比雪夫不等式估计

  • 当分布未知,而E(X)、D(X)已知时,可以估计$|x-E(X)|<\epsilon$的概率
  • 估计公式:$P{|X-\mu|\geq\epsilon}\leq \frac{\sigma^2}{\epsilon^2}$(大小不一)

4. 协方差与相关系数

  • 协方差:$Cov(X,Y)=E{[x-E(X)][y-E(Y)]}=E(XY)-E(X)E(Y)$
  • 相关系数:$\rho=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$

两大定律

分布A的样本:分布A中随机抽取若干x值序列,作为样本

1. 大数定律

  • 独立同分布的样本,$\bar X\stackrel{P}{\to}E(X)$
  • 独立重复实验的样本,$频率\frac{\bar f_X}{n}\stackrel{P}{\to}概率P$

2. 中心极限定律

  • 核心:将一般分布转成正态分布

  • 样本均值定律:

  • 独立同分布的样本,$\bar X\sim N(\mu,\frac{\sigma^2}{n})$
  • 独立重复实验的样本(比如二项分布的样本),$\bar X\sim N(\mu,\frac{\sigma^2}{n})=N(np,npq)$

  • 样本和定律:

  • 独立样本,$\sum^n_k x_k\sim N(\sum^n_k\mu,\sum^n_k\sigma^2)$
  • 独立同分布的样本,$\sum^n_k x_k\sim N(n\mu,\frac{(n\sigma)^2}{n})=N(n\mu,n\sigma^2)$

总体-样本-抽样

1. 样本分布函数

是一个分段分布函数,$F_n(x)=\frac{样本空间中,小于等于x的个数}{n}$

2. 统计量

  • 独立同分布的加法:基于样本和定律,先都变成对应的正态分布,然后进行正态的加法(期望加期望,方差加方差,还有带系数的情况)

  • 样本均值$\bar X$:

  • 均值分布$\bar X$:样本均值定律
  • 均值分布的期望:$E(\bar X)=总体分布E(X)=\mu$
  • (修正)样本方差$S^2$:$\frac{1}{n-1} \sum^n_k(x_i-\bar X)^2$,==除以n-1==使得特性较好
  • 方差分布的期望:$E(S^2)=总体分布D(X)=\sigma^2$

3. 样本与[一般]总体关系

  • 总结

  • 独立同分布的加法

  • 样本均值分布可求:$\bar X\sim N(\mu,\frac{\sigma^2}{n})$
    • E(样本均值)=总体期望
    • D(样本均值)
  • E(样本方差)=总体方差

4. 抽样分布

自由度:抽样次数(即抽样出的样本个数)

抽样分布:从多个独立的分布中抽样,得到多个样本序列,将之复合

  • 卡方分布$\chi^2$(正态的复合)

  • x抽样自标准正态分布:$x_i\sim N(0,1)$

  • $X=\sum_k^nx_i^2$

  • 记为$X\sim \chi^2(n)$
  • 性质:

    • 可加性:自由度相加
    • E(X)=n,D(X)=2n
  • t分布(正卡的复合)

  • $X\sim N(0,1),Y\sim \chi^2(n)$

  • $Z=\frac{X}{\sqrt{Y/n}}$
  • 记为$X\sim t(n)$
  • 性质:

    • E(X)=0,D(X)=n/(n-2)
    • 由于n->∞时,D(X)=1,所以此时t分布近似为一个标准正态分布
  • F分布(卡卡的复合)

  • $X\sim \chi^2(n_1),Y\sim \chi^2(n_2)$

  • $Z=\frac{X/n_1}{Y/n_2}$
  • 记为$Z\sim F(n_1,n_2)$
  • 性质:
    • 若X服从F,则1/X也服从F

5. 样本与[正态]总体的关系2

  • 前提:总体为$X\sim N(\mu,\sigma^2)$
  • n-1卡方定律:$\frac{S^2}{\sigma^2}(n-1)\sim \chi^2(n-1)$
  • n-1t定律:$\frac{\bar X-\mu}{S/\sqrt{n}}\sim t(n-1)$
  • $\bar X与S^2互相独立$
  • 总结
  • 方差/方差的分布=n-1卡方
  • 均值分布的标准化=n-1t

参数估计(仅点估计)

目的:估计密度函数中的参数

1. 矩估计法

  • k阶样本矩:$\frac{\sum^n_i x_i^k}{n}$

  • 核心:替换与反解

  • 思路:求总体矩(函数),用k阶样本矩A(已知量)代替k阶总体矩$E(X^k)$,反解里面的参数V,得到V=g(A)

  • k=1时,A=样本均值

2. 最大似然估计法

  • 样本似然函数$L(\theta)$:样本概率之积
  • 由于样本间独立,所以样本同时发生的概率=各自概率之积(样本总密度=各自密度之积)
  • 注意:只能x必须大于0,才能参与连乘
  • 核心:似然、对数、最大值

  • 思路:使得似然函数最大的参数,一定最适合作为估计值