一、数学期望(Expectation)

1. 定义与公式推导

  • 离散型随机变量:设离散型随机变量XXX,其可能取值为xix_ixii =1,2,3,⋯i \ = 1, 2, 3, \cdotsi =1,2,3,),对应概率为P(X =xi)P(X \ = x_i)P(X =xi)。数学期望E(X)E(X)E(X)可直观理解为XXX在大量重复试验下取值的平均水平。从加权平均视角出发,每个取值xix_ixi乘以自身出现概率P(X =xi)P(X \ = x_i)P(X =xi),再将所有乘积相加,即得期望:E(X) =∑ixi⋅P(X =xi)E(X) \ = \sum_{i} x_i \cdot P(X \ = x_i)E(X) =ixiP(X =xi)
    • 实例:抛一枚不均匀硬币,正面朝上得222分,反面朝上得111分,正面朝上概率为0.40.40.4,反面朝上概率为0.60.60.6。设得分随机变量为XXX,则E(X) =2×0.4+1×0.6 =1.4E(X) \ = 2×0.4 + 1×0.6 \ = 1.4E(X) =2×0.4+1×0.6 =1.4分,此即为平均每次抛硬币的期望得分。这表明,若多次重复抛这枚硬币,平均下来每次得分接近1.41.41.4分。
  • 连续型随机变量:对于连续型随机变量XXX,其概率密度函数为f(x)f(x)f(x)。我们将区间[−∞,+∞][-\infty, +\infty][,+]无限细分,取一小段区间[x,x+Δx][x, x + \Delta x][x,x+Δx],在此小区间上,随机变量XXX取值概率近似为f(x)Δxf(x)\Delta xf(x)Δx(类似离散型中某个取值概率),那么该小区间上XXX取值乘以概率近似为x⋅f(x)Δxx \cdot f(x)\Delta xxf(x)Δx。对所有小区间求和(即积分),可得连续型随机变量期望:E(X) =∫−∞+∞x⋅f(x) dxE(X) \ = \int_{-\infty}^{+\infty} x \cdot f(x) \, dxE(X) =+xf(x)dx
    • 实例:已知某电子元件寿命XXX(单位:小时)服从概率密度函数f(x) =λe−λx(x>0)f(x) \ = \lambda e^{-\lambda x} (x > 0)f(x) =λeλx(x>0)(指数分布,λ>0\lambda > 0λ>0),求其平均寿命(即E(X)E(X)E(X))。通过积分运算:
      E(X)=∫0+∞x⋅λe−λxdx=[−xe−λx]0+∞+∫0+∞e−λxdx(利用分部积分法,令u=x,dv=λe−λxdx)=0+[−1λe−λx]0+∞=1λ \begin{align*} E(X)&=\int_{0}^{+\infty}x\cdot\lambda e^{-\lambda x}dx\\ &=\left[-xe^{-\lambda x}\right]_0^{+\infty}+\int_{0}^{+\infty}e^{-\lambda x}dx&\text{(利用分部积分法,令}u = x\text{,}dv = \lambda e^{-\lambda x}dx\text{)}\\ &=0+\left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^{+\infty}\\ &=\frac{1}{\lambda} \end{align*} E(X)=0+xλeλxdx=[xeλx]0++0+eλxdx=0+[λ1eλx]0+=λ1(利用分部积分法,令u=xdv=λeλxdx

所以该电子元件平均寿命为1λ\frac{1}{\lambda}λ1小时,意味着大量这种电子元件的平均使用时长趋近于1λ\frac{1}{\lambda}λ1小时。

2. 运算性质推导与实例

  • 常数性质E(C) =CE(C) \ = CE(C) =CCCC为常数)。由于常数CCC可视为取值恒为CCC的随机变量,其出现概率为111,依据期望定义可得:E(C) =C×1 =CE(C) \ = C×1 \ = CE(C) =C×1 =C
    • 实例:无论进行多少次试验,某个固定奖励始终是555元,此奖励的期望即为555元。这说明在这种确定性情境下,期望就是固定值本身。
  • 线性性E(aX+bY+c) =aE(X)+bE(Y)+cE(aX + bY + c) \ = aE(X) + bE(Y) + cE(aX+bY+c) =aE(X)+bE(Y)+c(无论XXXYYY是否独立)。
    • 首先推导E(aX+c)E(aX + c)E(aX+c):设Z =aX+cZ \ = aX + cZ =aX+c,根据期望定义:
      E(Z) =∑i(axi+c)⋅P(X =xi) =∑i(axi⋅P(X =xi)+c⋅P(X =xi)) =a∑ixi⋅P(X =xi)+c∑iP(X =xi) \begin{align*} E(Z) &\ = \sum_{i} (ax_i + c) \cdot P(X \ = x_i)\\ &\ = \sum_{i} (ax_i \cdot P(X \ = x_i) + c \cdot P(X \ = x_i))\\ &\ = a\sum_{i} x_i \cdot P(X \ = x_i) + c\sum_{i} P(X \ = x_i) \end{align*} E(Z) =i(axi+c)P(X =xi) =i(axiP(X =xi)+cP(X =xi)) =aixiP(X =xi)+ciP(X =xi)
      因为∑iP(X =xi) =1\sum_{i} P(X \ = x_i) \ = 1iP(X =xi) =1,且E(X) =∑ixi⋅P(X =xi)E(X) \ = \sum_{i} x_i \cdot P(X \ = x_i)E(X) =ixiP(X =xi),所以E(aX+c) =aE(X)+cE(aX + c) \ = aE(X) + cE(aX+c) =aE(X)+c
    • 同理推导E(aX+bY+c)E(aX + bY + c)E(aX+bY+c):可先将其拆分为E(aX+(bY+c))E(aX + (bY + c))E(aX+(bY+c)),利用上述结论可得:
      E(aX+bY+c) =aE(X)+E(bY+c) =aE(X)+bE(Y)+cE(aX + bY + c) \ = aE(X) + E(bY + c) \ = aE(X) + bE(Y) + cE(aX+bY+c) =aE(X)+E(bY+c) =aE(X)+bE(Y)+c
    • 实例:已知投资项目AAA收益XXX期望为101010万元,投资项目BBB收益YYY期望为888万元,某人计划投资项目AAA资金为333倍本金,投资项目BBB资金为222倍本金,同时还有固定成本111万元,设总收益为ZZZ,则Z =3X+2Y−1Z \ = 3X + 2Y - 1Z =3X+2Y1。根据线性性:
      E(Z) =3E(X)+2E(Y)−1 =3×10+2×8−1 =45E(Z) \ = 3E(X) + 2E(Y) - 1 \ = 3×10 + 2×8 - 1 \ = 45E(Z) =3E(X)+2E(Y)1 =3×10+2×81 =45万元,即总收益期望为454545万元。这为投资者预估综合收益提供了量化依据,助其合理规划投资。
  • 独立变量的乘积期望:若XXXYYY独立,则E(XY) =E(X)⋅E(Y)E(XY) \ = E(X) \cdot E(Y)E(XY) =E(X)E(Y)。当XXXYYY独立时,联合概率分布P(X =xi,Y =yj) =P(X =xi)⋅P(Y =yj)P(X \ = x_i, Y \ = y_j) \ = P(X \ = x_i) \cdot P(Y \ = y_j)P(X =xi,Y =yj) =P(X =xi)P(Y =yj)
    E(XY) =∑i∑jxiyj⋅P(X =xi,Y =yj) =∑i∑jxiyj⋅P(X =xi)⋅P(Y =yj) \begin{align*} E(XY) &\ = \sum_{i} \sum_{j} x_i y_j \cdot P(X \ = x_i, Y \ = y_j)\\ &\ = \sum_{i} \sum_{j} x_i y_j \cdot P(X \ = x_i) \cdot P(Y \ = y_j) \end{align*} E(XY) =ijxiyjP(X =xi,Y =yj) =ijxiyjP(X =xi)P(Y =yj)
    A =∑ixi⋅P(X =xi) =E(X)A \ = \sum_{i} x_i \cdot P(X \ = x_i) \ = E(X)A =ixiP(X =xi) =E(X)B =∑jyj⋅P(Y =yj) =E(Y)B \ = \sum_{j} y_j \cdot P(Y \ = y_j) \ = E(Y)B =jyjP(Y =yj) =E(Y),则:
    E(XY) =∑i∑jxiyj⋅P(X =xi)⋅P(Y =yj) =∑ixi⋅P(X =xi)⋅∑jyj⋅P(Y =yj) =E(X)⋅E(Y)E(XY) \ = \sum_{i} \sum_{j} x_i y_j \cdot P(X \ = x_i) \cdot P(Y \ = y_j) \ = \sum_{i} x_i \cdot P(X \ = x_i) \cdot \sum_{j} y_j \cdot P(Y \ = y_j) \ = E(X) \cdot E(Y)E(XY) =ijxiyjP(X =xi)P(Y =yj) =ixiP(X =xi)jyjP(Y =yj) =E(X)E(Y)
    • 实例:工厂生产两种产品AAABBB,产品AAA产量XXX与产品BBB产量YYY相互独立,产品AAA平均每天生产100100100件,每件利润期望为555元,产品BBB平均每天生产808080件,每件利润期望为333元,设总利润为Z =XYZ \ = XYZ =XY,则:
      E(Z) =E(X)⋅E(Y) =100×5×80×3 =120000E(Z) \ = E(X) \cdot E(Y) \ = 100×5×80×3 \ = 120000E(Z) =E(X)E(Y) =100×5×80×3 =120000元,即总利润期望为121212万元。此例展示了独立变量乘积期望在生产利润估算中的应用。

例题 1:设XXX的分布律为P(X =1) =0.3P(X \ = 1) \ = 0.3P(X =1) =0.3P(X =2) =0.7P(X \ = 2) \ = 0.7P(X =2) =0.7,求E(2X+3)E(2X + 3)E(2X+3)

  • 解:首先求E(X)E(X)E(X),依据离散型随机变量期望公式:
    E(X) =1×0.3+2×0.7 =1.7E(X) \ = 1×0.3 + 2×0.7 \ = 1.7E(X) =1×0.3+2×0.7 =1.7
    再根据线性性E(aX+b)E(aX + b)E(aX+b)性质:
    E(2X+3) =2E(X)+3 =2×1.7+3 =6.4E(2X + 3) \ = 2E(X) + 3 \ = 2×1.7 + 3 \ = 6.4E(2X+3) =2E(X)+3 =2×1.7+3 =6.4

二、方差(Variance)

1. 定义与公式推导

方差用于衡量随机变量取值与其期望的偏离程度。设随机变量XXX期望为E(X)E(X)E(X),定义D(X) =E[(X−E(X))2]D(X) \ = E\left[ (X - E(X))^2 \right]D(X) =E[(XE(X))2],它表示XXX取值与期望差值平方的期望。展开式子可得:
D(X) =E[X2−2XE(X)+(E(X))2] =E(X2)−2E(X)⋅E(X)+(E(X))2 =E(X2)−[E(X)]2 \begin{align*} D(X) &\ = E\left[ X^2 - 2XE(X) + (E(X))^2 \right]\\ &\ = E(X^2) - 2E(X) \cdot E(X) + (E(X))^2\\ &\ = E(X^2) - [E(X)]^2 \end{align*} D(X) =E[X22XE(X)+(E(X))2] =E(X2)2E(X)E(X)+(E(X))2 =E(X2)[E(X)]2
例如,在一次射击比赛中,选手射击成绩XXX期望E(X) =8E(X) \ = 8E(X) =8环。若方差D(X)D(X)D(X)较大,意味着选手成绩波动剧烈,可能某次超常发挥接近101010环,某次却发挥失常仅666环;反之,方差较小则成绩相对稳定,多集中在888环附近。方差直观反映了数据的离散程度。

2. 运算性质推导与实例

  • 常数性质D(C) =0D(C) \ = 0D(C) =0。因为常数CCC期望E(C) =CE(C) \ = CE(C) =C,依据方差公式:
    D(C) =E[(C−E(C))2] =E[(C−C)2] =0D(C) \ = E\left[ (C - E(C))^2 \right] \ = E\left[ (C - C)^2 \right] \ = 0D(C) =E[(CE(C))2] =E[(CC)2] =0
    • 实例:一个固定的温度值25℃25℃25℃,不存在波动变化,其方差即为000,这体现了常数的稳定性在方差上的体现。
  • 缩放性质D(aX+b) =a2D(X)D(aX + b) \ = a^2 D(X)D(aX+b) =a2D(X)
    • 首先求E(aX+b)E(aX + b)E(aX+b),由期望线性性可得E(aX+b) =aE(X)+bE(aX + b) \ = aE(X) + bE(aX+b) =aE(X)+b
    • 再求D(aX+b)D(aX + b)D(aX+b)
      D(aX+b) =E[((aX+b)−E(aX+b))2] =E[(aX+b−(aE(X)+b))2] =E[(aX−aE(X))2] =E[a2(X−E(X))2] =a2E[(X−E(X))2] =a2D(X) \begin{align*} D(aX + b) &\ = E\left[ ((aX + b) - E(aX + b))^2 \right]\\ &\ = E\left[ (aX + b - (aE(X) + b))^2 \right]\\ &\ = E\left[ (aX - aE(X))^2 \right]\\ &\ = E\left[ a^2 (X - E(X))^2 \right]\\ &\ = a^2 E\left[ (X - E(X))^2 \right]\\ &\ = a^2 D(X) \end{align*} D(aX+b) =E[((aX+b)E(aX+b))2] =E[(aX+b(aE(X)+b))2] =E[(aXaE(X))2] =E[a2(XE(X))2] =a2E[(XE(X))2] =a2D(X)
    • 实例:某产品尺寸XXX方差为0.10.10.1,若将尺寸统一放大222倍并加上3mm3mm3mm,即Y =2X+3Y \ = 2X + 3Y =2X+3,那么:
      D(Y) =22×D(X) =4×0.1 =0.4D(Y) \ = 2^2×D(X) \ = 4×0.1 \ = 0.4D(Y) =22×D(X) =4×0.1 =0.4,表明变换后的尺寸波动幅度增大,方差的变化反映了尺寸变换对离散程度的影响。
  • 独立变量的方差:若XXXYYY独立,则D(X+Y) =D(X)+D(Y)D(X + Y) \ = D(X) + D(Y)D(X+Y) =D(X)+D(Y)。已知XXXYYY独立,先求E(X+Y) =E(X)+E(Y)E(X + Y) \ = E(X) + E(Y)E(X+Y) =E(X)+E(Y)。再求D(X+Y)D(X + Y)D(X+Y)
    D(X+Y) =E[((X+Y)−E(X+Y))2] =E[(X+Y−(E(X)+E(Y)))2] =E[(X−E(X)+Y−E(Y))2] \begin{align*} D(X + Y) &\ = E\left[ ((X + Y) - E(X + Y))^2 \right]\\ &\ = E\left[ (X + Y - (E(X) + E(Y)))^2 \right]\\ &\ = E\left[ (X - E(X) + Y - E(Y))^2 \right] \end{align*} D(X+Y) =E[((X+Y)E(X+Y))2] =E[(X+Y(E(X)+E(Y)))2] =E[(XE(X)+YE(Y))2]
    展开得:
    E[(X−E(X))2+2(X−E(X))(Y−E(Y))+(Y−E(Y))2] =E[(X−E(X))2]+2E[(X−E(X))(Y−E(Y))]+E[(Y−E(Y))2] \begin{align*} E\left[ (X - E(X))^2 + 2(X - E(X))(Y - E(Y)) + (Y - E(Y))^2 \right] &\ = E\left[ (X - E(X))^2 \right] + 2E\left[ (X - E(X))(Y - E(Y)) \right] + E\left[ (Y - E(Y))^2 \right] \end{align*} E[(XE(X))2+2(XE(X))(YE(Y))+(YE(Y))2] =E[(XE(X))2]+2E[(XE(X))(YE(Y))]+E[(YE(Y))2]
    因为XXXYYY独立,根据协方差性质E[(X−E(X))(Y−E(Y))] =Cov(X,Y) =0E\left[ (X - E(X))(Y - E(Y)) \right] \ = \text{Cov}(X, Y) \ = 0E[(XE(X))(YE(Y))] =Cov(X,Y) =0,所以D(X+Y) =D(X)+D(Y)D(X + Y) \ = D(X) + D(Y)D(X+Y) =D(X)+D(Y)
    • 实例:两个独立生产车间,车间AAA产品质量指标XXX方差D(X) =2D(X) \ = 2D(X) =2,车间BBB产品质量指标YYY方差D(Y) =3D(Y) \ = 3D(Y) =3,那么两个车间产品综合质量指标Z =X+YZ \ = X + YZ =X+Y的方差:
      D(Z) =D(X)+D(Y) =2+3 =5D(Z) \ = D(X) + D(Y) \ = 2 + 3 \ = 5D(Z) =D(X)+D(Y) =2+3 =5。此例展示了独立变量方差在质量控制领域综合评估中的应用。

例题 2:设XXX服从参数为λ\lambdaλ的泊松分布,已知E(X) =2E(X) \ = 2E(X) =2,求D(3X−1)D(3X - 1)D(3X1)

  • 解:泊松分布性质:D(X) =E(X) =2D(X) \ = E(X) \ = 2D(X) =E(X) =2
    根据方差缩放性质:
    D(3X−1) =32D(X) =9×2 =18D(3X - 1) \ = 3^2 D(X) \ = 9×2 \ = 18D(3X1) =32D(X) =9×2 =18

三、协方差(Covariance)与相关系数(Correlation Coefficient)

1. 协方差定义推导

协方差用于描述两个变量的线性相关性。设XXXYYY是两个随机变量,为衡量它们协同变化程度,定义协方差:Cov(X,Y) =E[(X−E(X))(Y−E(Y))]\text{Cov}(X, Y) \ = E[(X - E(X))(Y - E(Y))]Cov(X,Y) =E[(XE(X))(YE(Y))]。展开可得:
Cov(X,Y) =E[XY−XE(Y)−YE(X)+E(X)E(Y)] =E(XY)−E(X)E(Y)−E(Y)E(X)+E(X)E(Y) =E(XY)−E(X)E(Y) \begin{align*} \text{Cov}(X, Y) &\ = E\left[ XY - XE(Y) - YE(X) + E(X)E(Y) \right]\\ &\ = E(XY) - E(X)E(Y) - E(Y)E(X) + E(X)E(Y)\\ &\ = E(XY) - E(X)E(Y) \end{align*} Cov(X,Y) =E[XYXE(Y)YE(X)+E(X)E(Y)] =E(XY)E(X)E(Y)E(Y)E(X)+E(X)E(Y) =E(XY)E(X)E(Y)
例如,研究学生数学成绩XXX和物理成绩YYY,若协方差为正,表明一般数学成绩好的学生,物理成绩也倾向于好,即两者有同向变化趋势;协方差为负,则表示两者呈反向变化趋势;协方差接近000,意味着两者线性相关性弱。

2. 协方差性质推导与实例

  • XXXYYY独立,则Cov(X,Y) =0\text{Cov}(X, Y) \ = 0Cov(X,Y) =0:当XXXYYY独立时,根据独立变量乘积期望性质E(XY) =E(X)⋅E(Y)E(XY) \ = E(X) \cdot E(Y)E(XY) =E(X)E(Y),代入协方差公式可得:
    Cov(X,Y) =E(XY)−E(X)E(Y) =E(X)⋅E(Y)−E(X)E(Y) =0\text{Cov}(X, Y) \ = E(XY) - E(X)E(Y) \ = E(X) \cdot E(Y) - E(X)E(Y) \ = 0Cov(X,Y) =E(XY)E(X)E(Y) =E(X)E(Y)E(X)E(Y) =0
    • 实例:随机抽取一些人的身高XXX和当天股票涨幅YYY,通常认为两者相互独立,计算协方差大概率接近000,即身高与股票涨幅基本不存在线性关联,反映了不同类型变量在现实中的独立性。
  • Cov(aX+b,cY+d) =ac⋅Cov(X,Y)\text{Cov}(aX + b, cY + d) \ = ac \cdot \text{Cov}(X, Y)Cov(aX+b,cY+d) =acCov(X,Y):先求E(aX+b) =aE(X)+bE(aX + b) \ = aE(X) + bE(aX+b) =aE(X)+bE(cY+d) =cE(Y)+dE(cY + d) \ = cE(Y) + dE(cY+d) =cE(Y)+d。再求Cov(aX+b,cY+d)\text{Cov}(aX + b, cY + d)Cov(aX+b,cY+d)
    Cov(aX+b,cY+d) =E[((aX+b)−E(aX+b))((cY+d)−E(cY+d))] =E[(aX+b−(aE(X)+b))((cY+d−(cE(Y)+d))] =E[(aX−aE(X))(cY−cE(Y))] =E[ac(X−E(X))(Y−E(Y))] =ac⋅E[(X−E(X))(Y−E(Y))] =ac⋅Cov(X,Y) \begin{align*} \text{Cov}(aX + b, cY + d) &\ = E\left[ ((aX + b) - E(aX + b))((cY + d) - E(cY + d)) \right]\\ &\ = E\left[ (aX + b - (aE(X) + b))((cY + d - (cE(Y) + d)) \right]\\ &\ = E\left[ (aX - aE(X))(cY - cE(Y)) \right]\\ &\ = E\left[ ac(X - E(X))(Y - E(Y)) \right]\\ &\ = ac \cdot E\left[ (X - E(X))(Y - E(Y)) \right]\\ &\ = ac \cdot \text{Cov}(X, Y) \end{align*} Cov(aX+b,cY+d) =E[((aX+b)E(aX+b))((cY+d)E(cY+d))] =E[(aX+b(aE(X)+b))((cY+d(cE(Y)+d))] =E[(aXaE(X))(cYcE(Y))] =E[ac(XE(X))(YE(Y))] =acE[(XE(X))(YE(Y))] =acCov(X,Y)
    • 实例:已知变量XXXYYY的协方差为555,令U =2X+3U \ = 2X + 3U =2X+3V =4Y−1V \ = 4Y - 1V =4Y1,则:
      Cov(U,V) =2×4×Cov(X,Y) =8×5 =40\text{Cov}(U, V) \ = 2×4×\text{Cov}(X, Y) \ = 8×5 \ = 40Cov(U,V) =2×4×Cov(X,Y) =8×5 =40。此性质展示了变量线性变换后协方差的变化规律,在处理数据变换时非常实用。

3. 相关系数定义与性质推导

相关系数是标准化的协方差:ρXY =Cov(X,Y)D(X)D(Y)\rho_{XY} \ = \frac{\text{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}ρXY =D(X) D(Y) Cov(X,Y)。为使衡量两个变量相关性的指标不受变量本身取值范围和单位的影响,对协方差进行标准化。

首先证明∣ρXY∣≤1|\rho_{XY}| \leq 1ρXY1:由柯西 - 施瓦茨不等式(E[(X−E(X))(Y−E(Y))])2≤E[(X−E(X))2]E[(Y−E(Y))2](E[(X - E(X))(Y - E(Y))])^2 \leq E\left[ (X - E(X))^2 \right] E\left[ (Y - E(Y))^2 \right](E[(XE(X))(YE(Y))])2E[(XE(X))2]E[(YE(Y))2],即(Cov(X,Y))2≤D(X)D(Y)(\text{Cov}(X, Y))^2 \leq D(X)D(Y)(Cov(X,Y))2D(X)D(Y)。两边同时开方再除以D(X)D(Y)\sqrt{D(X)} \sqrt{D(Y)}D(X) D(Y) 可得∣ρXY∣≤1|\rho_{XY}| \leq 1ρXY1

ρXY =0\rho_{XY} \ = 0ρXY =0表示XXXYYY不相关,但未必独立。因为不相关只是说明两者在线性关系上不紧密,但可能存在其他非线性关系。比如,在研究天气温度XXX和某商场冰淇淋销量YYY时,若ρXY =0\rho_{XY} \ = 0ρXY =0,可能在整体线性趋势上温度高低与冰淇淋销量没有明显的同步增减规律,但实际上,当温度极高或极低时,由于特殊的消费场景(如极热时大家抢购降温、极冷时商家促销热饮搭配),销量又会呈现特殊变化,并非完全独立,只是线性相关性不显著。

例题 3
XXXYYY的联合分布如下,求协方差和相关系数:

X\Y 0 1
0 0.1 0.4
1 0.3 0.2

解:
计算边缘分布:
对于XXXP(X =0) =0.1+0.4 =0.5P(X \ = 0) \ = 0.1 + 0.4 \ = 0.5P(X =0) =0.1+0.4 =0.5P(X =1) =0.3+0.2 =0.5P(X \ = 1) \ = 0.3 + 0.2 \ = 0.5P(X =1) =0.3+0.2 =0.5,则E(X) =0×0.5+1×0.5 =0.5E(X) \ = 0×0.5 + 1×0.5 \ = 0.5E(X) =0×0.5+1×0.5 =0.5
对于YYYP(Y =0) =0.1+0.3 =0.4P(Y \ = 0) \ = 0.1 + 0.3 \ = 0.4P(Y =0) =0.1+0.3 =0.4P(Y =1) =0.4+0.2 =0.6P(Y \ = 1) \ = 0.4 + 0.2 \ = 0.6P(Y =1) =0.4+0.2 =0.6,则E(Y) =0×0.4+1×0.6 =0.6E(Y) \ = 0×0.4 + 1×0.6 \ = 0.6E(Y) =0×0.4+1×0.6 =0.6

计算E(XY)E(XY)E(XY)
E(XY) =(0×0×0.1)+(0×1×0.4)+(1×0×0.3)+(1×1×0.2) =0.2E(XY) \ = (0×0×0.1) + (0×1×0.4) + (1×0×0.3) + (1×1×0.2) \ = 0.2E(XY) =(0×0×0.1)+(0×1×0.4)+(1×0×0.3)+(1×1×0.2) =0.2

协方差:
Cov(X,Y) =0.2−0.5×0.6 =−0.1\text{Cov}(X, Y) \ = 0.2 - 0.5×0.6 \ = -0.1Cov(X,Y) =0.20.5×0.6 =0.1

方差:
D(X) =0.5×(1−0.5)2+0.5×(0−0.5)2 =0.25D(X) \ = 0.5×(1 - 0.5)^2 + 0.5×(0 - 0.5)^2 \ = 0.25D(X) =0.5×(10.5)2+0.5×(00.5)2 =0.25
D(Y) =0.4×(0−0.6)2+0.6×(1−0.6)2 =0.24D(Y) \ = 0.4×(0 - 0.6)^2 + 0.6×(1 - 0.6)^2 \ = 0.24D(Y) =0.4×(00.6)2+0.6×(10.6)2 =0.24

相关系数:
ρXY =−0.10.25×0.24≈−0.408\rho_{XY} \ = \frac{-0.1}{\sqrt{0.25}×\sqrt{0.24}} \approx -0.408ρXY =0.25 ×0.24 0.10.408

四、连续型随机变量的二重积分应用

例题 4
(X,Y)(X, Y)(X,Y)的联合密度函数为f(x,y) =2e−x−yf(x, y) \ = 2e^{-x - y}f(x,y) =2exyx>0,y>0x > 0, y > 0x>0,y>0),求Cov(X,Y)\text{Cov}(X, Y)Cov(X,Y)

解:
边缘密度:
计算fX(x)f_X(x)fX(x)
fX(x) =∫0+∞2e−x−ydy =2e−x∫0+∞e−ydy =2e−xf_X(x) \ = \int_{0}^{+\infty} 2e^{-x - y} dy \ = 2e^{-x} \int_{0}^{+\infty} e^{-y} dy \ = 2e^{-x}fX(x) =0+2exydy =2ex0+eydy =2ex(因为∫0+∞e−ydy =1\int_{0}^{+\infty} e^{-y} dy \ = 10+eydy =1)。
同理,计算fY(y)f_Y(y)fY(y)
fY(y) =2e−yf_Y(y) \ = 2e^{-y}fY(y) =2ey

独立性检验:
由于f(x,y) =2e−x−y≠fX(x)fY(y) =4e−x−yf(x, y) \ = 2e^{-x - y} \neq f_X(x)f_Y(y) \ = 4e^{-x - y}f(x,y) =2exy=fX(x)fY(y) =4exy,所以XXXYYY不独立。

计算协方差:
先求E(X)E(X)E(X)
E(X) =∫0∞x⋅2e−xdxE(X) \ = \int_{0}^{\infty} x \cdot 2e^{-x} dxE(X) =0x2exdx,通过分部积分法(令u =xu \ = xu =xdv =e−xdxdv \ = e^{-x} dxdv =exdx)可得:
E(X) =∫0∞x⋅2e−xdx =[−xe−x]0∞+∫0∞e−xdx =0+[−e−x]0∞ =1×2 =2 \begin{align*} E(X) &\ = \int_{0}^{\infty} x \cdot 2e^{-x} dx\\ &\ = \left[-xe^{-x}\right]_0^{\infty} + \int_{0}^{\infty} e^{-x} dx\\ &\ = 0 + \left[-e^{-x}\right]_0^{\infty}\\ &\ = 1×2 \ = 2 \end{align*} E(X) =0x2exdx =[xex]0+0exdx =0+[ex]0 =1×2 =2
同理,E(Y) =2E(Y) \ = 2E(Y) =2

再求E(XY)E(XY)E(XY)
E(XY) =∬x>0,y>0xy⋅2e−x−ydxdyE(XY) \ = \iint_{x > 0, y > 0} xy \cdot 2e^{-x - y} dxdyE(XY) =x>0,y>0xy2exydxdy,利用分步积分两次,先对yyy积分再对xxx积分,可得:
E(XY) =∫0∞x⋅2e−x(∫0∞y⋅e−ydy)dx =∫0∞x⋅2e−x⋅1dx =2×1×1 =2 \begin{align*} E(XY) &\ = \int_{0}^{\infty} x \cdot 2e^{-x} \left(\int_{0}^{\infty} y \cdot e^{-y} dy\right) dx\\ &\ = \int_{0}^{\infty} x \cdot 2e^{-x} \cdot 1 dx\\ &\ = 2×1×1 \ = 2 \end{align*} E(XY) =0x2ex(0yeydy)dx =0x2ex1dx =2×1×1 =2
Cov(X,Y) =2−2×2 =−2\text{Cov}(X, Y) \ = 2 - 2×2 \ = -2Cov(X,Y) =22×2 =2

五、补充知识点

二维正态分布:

(X,Y)(X, Y)(X,Y)服从二维正态分布,则XXXYYY独立 ⇨XXXYYY不相关(反之不一定成立)。这是二维正态分布的一个特殊性质,在实际数据分析中,如果已知数据服从二维正态分布,那么判断独立性就可以转化为判断相关性,简化了分析过程。例如,在研究某些生物的体长XXX和体重YYY时,若它们服从二维正态分布,当发现两者不相关时,就能直接推断它们在概率意义上是相互独立的,即体长的变化基本不会线性地影响体重的变化,反之亦然。

切比雪夫不等式:

P(∣X−E(X)∣≥ϵ)≤D(X)ϵ2P(|X - E(X)| \geq \epsilon) \leq \frac{D(X)}{\epsilon^2}P(XE(X)ϵ)ϵ2D(X)。它给出了随机变量偏离其期望的概率上限估计。在实际应用中,比如生产质量控制,已知某产品尺寸XXX的期望E(X)E(X)E(X)和方差D(X)D(X)D(X),给定一个允许的误差范围ϵ\epsilonϵ,就能利用切比雪夫不等式大致估算出产品尺寸超出这个范围的概率上限,从而判断生产过程的稳定性。若发现概率上限过高,就需要调整生产工艺。

中心极限定理:

独立同分布随机变量和的标准化形式依分布收敛于标准正态分布。这意味着,无论原来的随机变量服从什么分布,只要满足独立同分布的条件,当样本量足够大时,它们的和经过标准化后,近似服从标准正态分布。例如,在统计大量投保人的索赔金额时,每个投保人的索赔金额可看作一个随机变量,这些随机变量通常独立同分布,虽然单个索赔金额分布可能很复杂,但随着投保人数量增多,总的索赔金额经过标准化后就近似服从标准正态分布,从而可以利用正态分布的性质进行风险评估和保费定价等操作。

总结:掌握数字特征的核心公式与运算性质,结合实例理解协方差与相关系数的实际意义,注意独立性与不相关性的区别。这些数字特征在金融风险评估、生产质量控制、教育成绩分析等众多领域都有着广泛的应用,为决策提供了有力的量化依据。希望通过本教程,大家能深入理解概率论与数理统计中的数字特征,并灵活运用到实际问题解决中。如果在学习过程中有任何疑问,欢迎随时交流探讨。

你是否还想了解更多关于概率论与数理统计的拓展知识,或是希望我提供一些相关练习题来巩固所学内容呢?可以随时告诉我。

Logo

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区,共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐