离散概率分布
对于任何具有离散分布的随机变量,其样本空间(大概的取值聚集)是有限的或可数无穷的,而且每个大概的取值都对应一个概率。
- 概率质量函数(PMF): 界说离散随机变量 X 取某个特定值的概率:
f(x)=P(X=x)
- 累积分布函数(CDF): 界说随机变量 X 小于或即是某个值的概率:
F(x)=P(X≤x)
- 性子:
- 概率总和为 1:
∑i=1∞P(X=xi)=1\sum_{i=1}^{\infty} P(X = x_i) = 1i=1∑∞P(X=xi)=1
- 概率非负: P(X=xi)≥0
- 不大概出现的变乱概率为 0,而肯定发生的变乱概率为 1: 0≤P(X=x)≤1
示例:掷一个公平的六面骰子
假设 X 表现掷一个公平六面骰子的效果,其大概的取值是:
X∈{1,2,3,4,5,6}
由于骰子是公平的,以是每个面出现的概率都是相称的,即:
P(X=x)={16,x∈{1,2,3,4,5,6}0,otherwiseP(X = x) = \begin{cases} \frac{1}{6}, & x \in \{1, 2, 3, 4, 5, 6\} \\ 0, & \text{otherwise} \end{cases}P(X=x)={61,0,x∈{1,2,3,4,5,6}otherwise
这就是骰子的概率质量函数(PMF)。
渴望的盘算 (1+2+3+4+5+6+) * 1/6 = 3.5
二项分布与连续分布
1. 二项分布(Binomial Distribution)
二项分布是用于建模二项试验(Bernoulli Trials)**的离散概率分布,实用于独立重复试验的场景,每次试验只有**乐成或失败两种效果。
- 设随机变量 X 表现 n 次独立伯努利试验中乐成的次数,每次试验乐成的概率为 p,则 X 服从二项分布:
S∼Binominal(p,n)
渴望是p x n,也是图中的中央
- 概率质量函数(PMF):
P(X=k)=(nk)pk(1−p)n−k,k=0,1,2,...,nP(X = k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k = 0,1,2,...,nP(X=k)=(kn)pk(1−p)n−k,k=0,1,2,...,n
此中:
(nk)=n!k!(n−k)! \binom{n}{k} = \frac{n!}{k!(n-k)!} (kn)=k!(n−k)!n!
是组合数,表现从 n次试验中选 k次乐成的大概方式。
pk p^k pk
表现 kkk 次乐成的概率。
(1−p)n−k (1-p)^{n-k} (1−p)n−k
表现别的 n−k 次失败的概率。
- 均值与方差:
E(X)=np,Var(X)=np(1−p)
- 示例: 如果一枚硬币抛 10 次,每次正面朝上的概率是 0.5,则 X(出现正面的次数)服从二项分布:
X∼Bin(10,0.5)
盘算 P(X=5):
P(X=5)=(105)(0.5)5(0.5)5=10!5!5!×0.510=0.246P(X = 5) = \binom{10}{5} (0.5)^5 (0.5)^5 = \frac{10!}{5!5!} \times 0.5^{10} = 0.246P(X=5)=(510)(0.5)5(0.5)5=5!5!10!×0.510=0.246
2. 连续分布(Continuous Distributions)
如果随机变量 X 取值为不可数的无穷多个值,则它服从连续概率分布。比方,一个人的身高可以是恣意实数(如 170.5cm),而不是离散的整数值(如 170cm 或 171cm)。
- 概率密度函数(PDF): 对于连续随机变量,点概率 P(X=x)=0,但可以通过概率密度函数 f(x) 盘算一个区间的概率:
P(a≤X≤b)=∫abf(x)dxP(a \leq X \leq b) = \int_{a}^{b} f(x) dxP(a≤X≤b)=∫abf(x)dx
性子:
- f(x)≥0(密度非负)
- 总概率为 1:
∫−∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x) dx = 1∫−∞∞f(x)dx=1
- 累计分布函数(CDF):
F(x)=P(X≤x)=∫−∞xf(t)dtF(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) dtF(x)=P(X≤x)=∫−∞xf(t)dt
- 示例:标准正态分布: 正态分布是最常见的连续分布,表现为:
X∼N(μ,σ^2)
此中:
- μ 是均值(渴望值)
- σ^2 是方差(标准差 σ的平方)
- 概率密度函数(PDF):
f(x)=12πσ2e−(x−μ)22σ2f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}f(x)=2πσ21e−2σ2(x−μ)2
示例盘算: 在 R 语言中,dnorm(10, 10, 0.1)
盘算的是 N(10,0.12) 在 x=10x 处的概率密度: 在连续型概率分布的概率密度函数(PDF)\中,确实大概出现 f(x)>1 的情况。这并不违背概率的根本规则。缘故原由如下:
1. PDF 的关键性子
一个概率密度函数 f(x) 必须满足以下条件:
- 非负性:对全部 x ,都有 f(x)≥0
- 总概率为 1:整个界说域上的积分必须即是 1,即:
∫−∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x)dx = 1∫−∞∞f(x)dx=1
2. 为什么 f(x)>1大概创建?
在连续分布中,f(x) 表现的是概率密度,而不是详细的概率值。概率密度的物理意义是单元区间内的概率值,而不是点的概率值。因此,f(x) 只要在整个界说域上的面积(积分)仍然是 1,就不会违背概率规则。
- 比方:匀称分布 U(0, 0.5)
f(x)={2,0≤x≤0.50,其他f(x) = \begin{cases} 2, & 0 \leq x \leq 0.5 \\ 0, & 其他 \end{cases}f(x)={2,0,0≤x≤0.5其他
这里 f(x)=2显着大于 1,但满足:
∫00.52dx=1\int_0^{0.5} 2dx = 1∫00.52dx=1
以是仍然是正当的概率密度函数。
3. 何时 f(x)不大概大于 1?
对于离散型分布(如二项分布、泊松分布),概率质量函数(PMF)P(X=x) 必须满足 P(X=x)≤1,由于它表现详细的概率值,而不是概率密度。因此,在离散分布中,不大概出现概率大于 1 的情况。
总结
- 连续分布的 PDF 允许 f(x)>1,只要总概率(积分)仍然即是 1。
- 离散分布的 PMF 不能大于 1,由于它表现详细的概率。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |