离散概率分布:正态分布,二项分布,连续分布,正态分布的性子

[复制链接]
发表于 2025-10-12 08:07:11 | 显示全部楼层 |阅读模式
离散概率分布

对于任何具有离散分布的随机变量,其样本空间(大概的取值聚集)是有限的可数无穷的,而且每个大概的取值都对应一个概率。

  • 概率质量函数(PMF): 界说离散随机变量 X 取某个特定值的概率:
    f(x)=P(X=x)
  • 累积分布函数(CDF): 界说随机变量 X 小于或即是某个值的概率:
    F(x)=P(X≤x)
  • 性子

    • 概率总和为 1:
      ∑i=1∞P(X=xi)=1\sum_{i=1}^{\infty} P(X = x_i) = 1i=1∑∞​P(X=xi​)=1
    • 概率非负: P(X=xi)≥0
    • 不大概出现的变乱概率为 0,而肯定发生的变乱概率为 1: 0≤P(X=x)≤1

示例:掷一个公平的六面骰子

假设 X 表现掷一个公平六面骰子的效果,其大概的取值是:
X∈{1,2,3,4,5,6}
由于骰子是公平的,以是每个面出现的概率都是相称的,即:
P(X=x)={16,x∈{1,2,3,4,5,6}0,otherwiseP(X = x) = \begin{cases}  \frac{1}{6}, & x \in \{1, 2, 3, 4, 5, 6\} \\ 0, & \text{otherwise} \end{cases}P(X=x)={61​,0,​x∈{1,2,3,4,5,6}otherwise​
这就是骰子的概率质量函数(PMF)
渴望的盘算 (1+2+3+4+5+6+) * 1/6 = 3.5
二项分布与连续分布

1. 二项分布(Binomial Distribution)

二项分布是用于建模二项试验(Bernoulli Trials)**的离散概率分布,实用于独立重复试验的场景,每次试验只有**乐成或失败两种效果。

  • 设随机变量 X 表现 n 次独立伯努利试验中乐成的次数,每次试验乐成的概率为 p,则 X 服从二项分布
    S∼Binominal(p,n)
    渴望是p x n,也是图中的中央


  • 概率质量函数(PMF)
    P(X=k)=(nk)pk(1−p)n−k,k=0,1,2,...,nP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0,1,2,...,nP(X=k)=(kn​)pk(1−p)n−k,k=0,1,2,...,n
    此中:
    (nk)=n!k!(n−k)!  \binom{n}{k} = \frac{n!}{k!(n-k)!}  (kn​)=k!(n−k)!n!​
    是组合数,表现从 n次试验中选 k次乐成的大概方式。
    pk  p^k  pk
    表现 kkk 次乐成的概率。
    (1−p)n−k  (1-p)^{n-k}  (1−p)n−k
    表现别的 n−k 次失败的概率。
  • 均值与方差
    E(X)=np,Var(X)=np(1−p)
  • 示例: 如果一枚硬币抛 10 次,每次正面朝上的概率是 0.5,则 X(出现正面的次数)服从二项分布:
    X∼Bin(10,0.5)
    盘算 P(X=5):
    P(X=5)=(105)(0.5)5(0.5)5=10!5!5!×0.510=0.246P(X = 5) = \binom{10}{5} (0.5)^5 (0.5)^5 = \frac{10!}{5!5!} \times 0.5^{10} = 0.246P(X=5)=(510​)(0.5)5(0.5)5=5!5!10!​×0.510=0.246

2. 连续分布(Continuous Distributions)

如果随机变量 X 取值为不可数的无穷多个值,则它服从连续概率分布。比方,一个人的身高可以是恣意实数(如 170.5cm),而不是离散的整数值(如 170cm 或 171cm)。

  • 概率密度函数(PDF): 对于连续随机变量,点概率 P(X=x)=0,但可以通过概率密度函数 f(x) 盘算一个区间的概率:
    P(a≤X≤b)=∫abf(x)dxP(a \leq X \leq b) = \int_{a}^{b} f(x) dxP(a≤X≤b)=∫ab​f(x)dx
    性子

    • f(x)≥0(密度非负)
    • 总概率为 1
      ∫−∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x) dx = 1∫−∞∞​f(x)dx=1
    • 累计分布函数(CDF)
      F(x)=P(X≤x)=∫−∞xf(t)dtF(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) dtF(x)=P(X≤x)=∫−∞x​f(t)dt

  • 示例:标准正态分布正态分布是最常见的连续分布,表现为:
    X∼N(μ,σ^2)
    此中:

    • μ 是均值(渴望值)
    • σ^2 是方差(标准差 σ的平方)
    • 概率密度函数(PDF)
      f(x)=12πσ2e−(x−μ)22σ2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}f(x)=2πσ2​1​e−2σ2(x−μ)2​
    示例盘算: 在 R 语言中,dnorm(10, 10, 0.1)
    盘算的是 N(10,0.12) 在 x=10x 处的概率密度:
    1. dnorm(10, 10, 0.1)
    复制代码
连续型概率分布概率密度函数(PDF)\中,确实大概出现 f(x)>1 的情况。这并不违背概率的根本规则。缘故原由如下:
1. PDF 的关键性子

一个概率密度函数 f(x) 必须满足以下条件:

  • 非负性:对全部 x ,都有 f(x)≥0
  • 总概率为 1:整个界说域上的积分必须即是 1,即:
    ∫−∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x)dx = 1∫−∞∞​f(x)dx=1
2. 为什么 f(x)>1大概创建?

在连续分布中,f(x) 表现的是概率密度,而不是详细的概率值。概率密度的物理意义是单元区间内的概率值,而不是点的概率值。因此,f(x) 只要在整个界说域上的面积(积分)仍然是 1,就不会违背概率规则。

  • 比方:匀称分布 U(0, 0.5)
    f(x)={2,0≤x≤0.50,其他f(x) = \begin{cases} 2, & 0 \leq x \leq 0.5 \\ 0, & 其他 \end{cases}f(x)={2,0,​0≤x≤0.5其他​
    这里 f(x)=2显着大于 1,但满足:
    ∫00.52dx=1\int_0^{0.5} 2dx = 1∫00.5​2dx=1
    以是仍然是正当的概率密度函数。
3. 何时 f(x)不大概大于 1?

对于离散型分布(如二项分布、泊松分布),概率质量函数(PMF)P(X=x) 必须满足 P(X=x)≤1,由于它表现详细的概率值,而不是概率密度。因此,在离散分布中,不大概出现概率大于 1 的情况
总结


  • 连续分布的 PDF 允许 f(x)>1,只要总概率(积分)仍然即是 1。
  • 离散分布的 PMF 不能大于 1,由于它表现详细的概率。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表