离散概率分布：正态分布，二项分布，连续分布，正态分布的性子

登录 · 发表于 2025-10-12 08:07:11

离散概率分布

对于任何具有离散分布的随机变量，其样本空间（大概的取值聚集）是有限的或可数无穷的，而且每个大概的取值都对应一个概率。

概率质量函数（PMF）：界说离散随机变量 X 取某个特定值的概率：
f(x)=P(X=x)
累积分布函数（CDF）：界说随机变量 X 小于或即是某个值的概率：
F(x)=P(X≤x)
性子：
- 概率总和为 1：
  ∑i=1∞P(X=xi)=1\sum_{i=1}^{\infty} P(X = x_i) = 1i=1∑∞P(X=xi)=1
- 概率非负： P(X=xi)≥0
- 不大概出现的变乱概率为 0，而肯定发生的变乱概率为 1： 0≤P(X=x)≤1

示例：掷一个公平的六面骰子

假设 X 表现掷一个公平六面骰子的效果，其大概的取值是：
X∈{1,2,3,4,5,6}
由于骰子是公平的，以是每个面出现的概率都是相称的，即：
P(X=x)={16,x∈{1,2,3,4,5,6}0,otherwiseP(X = x) = \begin{cases} \frac{1}{6}, & x \in \{1, 2, 3, 4, 5, 6\} \\ 0, & \text{otherwise} \end{cases}P(X=x)={61,0,x∈{1,2,3,4,5,6}otherwise
这就是骰子的概率质量函数（PMF）。
渴望的盘算 (1+2+3+4+5+6+) * 1/6 = 3.5
二项分布与连续分布

1. 二项分布（Binomial Distribution）

二项分布是用于建模二项试验（Bernoulli Trials）**的离散概率分布，实用于独立重复试验的场景，每次试验只有**乐成或失败两种效果。

设随机变量 X 表现 n 次独立伯努利试验中乐成的次数，每次试验乐成的概率为 p，则 X 服从二项分布：
S∼Binominal(p,n)
渴望是p x n，也是图中的中央

概率质量函数（PMF）：
P(X=k)=(nk)pk(1−p)n−k,k=0,1,2,...,nP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0,1,2,...,nP(X=k)=(kn)pk(1−p)n−k,k=0,1,2,...,n
此中：
(nk)=n!k!(n−k)!  \binom{n}{k} = \frac{n!}{k!(n-k)!}  (kn)=k!(n−k)!n!
是组合数，表现从 n次试验中选 k次乐成的大概方式。
pk  p^k  pk
表现 kkk 次乐成的概率。
(1−p)n−k  (1-p)^{n-k}  (1−p)n−k
表现别的 n−k 次失败的概率。
均值与方差：
E(X)=np,Var(X)=np(1−p)
示例：如果一枚硬币抛 10 次，每次正面朝上的概率是 0.5，则 X（出现正面的次数）服从二项分布：
X∼Bin(10,0.5)
盘算 P(X=5)：
P(X=5)=(105)(0.5)5(0.5)5=10!5!5!×0.510=0.246P(X = 5) = \binom{10}{5} (0.5)^5 (0.5)^5 = \frac{10!}{5!5!} \times 0.5^{10} = 0.246P(X=5)=(510)(0.5)5(0.5)5=5!5!10!×0.510=0.246

2. 连续分布（Continuous Distributions）

如果随机变量 X 取值为不可数的无穷多个值，则它服从连续概率分布。比方，一个人的身高可以是恣意实数（如 170.5cm），而不是离散的整数值（如 170cm 或 171cm）。

概率密度函数（PDF）：对于连续随机变量，点概率 P(X=x)=0，但可以通过概率密度函数 f(x) 盘算一个区间的概率：
P(a≤X≤b)=∫abf(x)dxP(a \leq X \leq b) = \int_{a}^{b} f(x) dxP(a≤X≤b)=∫abf(x)dx
性子：
- f(x)≥0（密度非负）
- 总概率为 1：
  ∫−∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x) dx = 1∫−∞∞f(x)dx=1
- 累计分布函数（CDF）：
  F(x)=P(X≤x)=∫−∞xf(t)dtF(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) dtF(x)=P(X≤x)=∫−∞xf(t)dt
示例：标准正态分布： 正态分布是最常见的连续分布，表现为：
X∼N(μ,σ^2)
此中：
- μ 是均值（渴望值）
- σ^2 是方差（标准差 σ的平方）
- 概率密度函数（PDF）：
  f(x)=12πσ2e−(x−μ)22σ2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}f(x)=2πσ21e−2σ2(x−μ)2
示例盘算：在 R 语言中，dnorm(10, 10, 0.1)
盘算的是 N(10,0.12) 在 x=10x 处的概率密度：
1. dnorm(10, 10, 0.1)
复制代码

在连续型概率分布的概率密度函数（PDF）\中，确实大概出现 f(x)>1 的情况。这并不违背概率的根本规则。缘故原由如下：
1. PDF 的关键性子

一个概率密度函数 f(x) 必须满足以下条件：

非负性：对全部 x ，都有 f(x)≥0
总概率为 1：整个界说域上的积分必须即是 1，即：
∫−∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x)dx = 1∫−∞∞f(x)dx=1

2. 为什么 f(x)>1大概创建？

在连续分布中，f(x) 表现的是概率密度，而不是详细的概率值。概率密度的物理意义是单元区间内的概率值，而不是点的概率值。因此，f(x) 只要在整个界说域上的面积（积分）仍然是 1，就不会违背概率规则。

比方：匀称分布 U(0, 0.5)
f(x)={2,0≤x≤0.50,其他f(x) = \begin{cases} 2, & 0 \leq x \leq 0.5 \\ 0, & 其他 \end{cases}f(x)={2,0,0≤x≤0.5其他
这里 f(x)=2显着大于 1，但满足：
∫00.52dx=1\int_0^{0.5} 2dx = 1∫00.52dx=1
以是仍然是正当的概率密度函数。

3. 何时 f(x)不大概大于 1？

对于离散型分布（如二项分布、泊松分布），概率质量函数（PMF）P(X=x) 必须满足 P(X=x)≤1，由于它表现详细的概率值，而不是概率密度。因此，在离散分布中，不大概出现概率大于 1 的情况。
总结

连续分布的 PDF 允许 f(x)>1，只要总概率（积分）仍然即是 1。
离散分布的 PMF 不能大于 1，由于它表现详细的概率。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

离散概率分布：正态分布，二项分布，连续分布，正态分布的性子

本帖子中包含更多资源

郭卫东