查看“︁卜瓦松二項分布”︁的源代码
←
卜瓦松二項分布
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1=Math }} {{Infobox 機率分佈|name=卜瓦松二項分布<br/>Poisson binomial|type=mass|parameters=<math>n \in \mathbb N</math>(試驗數)<br/><math>\mathbf{p}\in [0,1]^n</math>(各試驗的成功概率)|support=''k'' ∈ { 0, …, ''n'' }|pdf=<math>\sum\limits_{A\in F_k} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c} (1-p_j)</math>|cdf=<math>\sum\limits_{l=0}^k \sum\limits_{A\in F_l} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c} (1-p_j)</math>|mean=<math>\sum\limits_{i=1}^n p_i</math>|median=|mode=|variance=<math> \sigma^2 =\sum\limits_{i=1}^n (1 - p_i)p_i</math>|skewness=<math>\frac{1}{\sigma^3}\sum\limits_{i=1}^n ( 1-2p_i ) ( 1-p_i ) p_i</math>|kurtosis=<math>\frac{1}{\sigma^4}\sum\limits_{i=1}^n ( 1 - 6(1 - p_i)p_i )( 1 - p_i )p_i</math>|entropy=|mgf=<math>\prod\limits_{j=1}^n (1-p_j+p_j e^t)</math>|cf=<math>\prod\limits_{j=1}^n (1-p_j+p_j e^{it})</math>|pgf=<math>\prod\limits_{j=1}^n (1-p_j+p_j z)</math>}} 在[[概率论|機率论]]和[[统计学]]中,'''卜瓦松二项分布'''是一個基於[[独立 (概率论)|独立]][[伯努利試驗|伯努利试验]]之和的[[概率分布|离散機率分布]]。这一概念以[[西梅翁·德尼·泊松]]的名字命名。 换句话说,它是成功概率分別為<math>p_1, p_2, \dots, p_n</math>的''n''次[[独立 (概率论)|独立]]伯努利试验中,成功次数的[[概率分布|機率分布]]。普通[[二項式分布|二项分布]]是卜瓦松二项分布在所有成功機率相同(即<math>p_1 = p_2 = \cdots = p_n</math>)时的特例。 == 定義 == === 機率质量函数 === ''n''次试验中有''k''次成功的機率可以写为以下总和<ref>{{Cite journal |last=Wang |first=Y. H. |year=1993 |title=On the number of successes in independent trials |url=http://www3.stat.sinica.edu.tw/statistica/oldpdf/A3n23.pdf |journal=Statistica Sinica |volume=3 |issue=2 |page=295–312 |access-date=2023-07-29 |archive-date=2016-03-03 |archive-url=https://web.archive.org/web/20160303182353/http://www3.stat.sinica.edu.tw/statistica/oldpdf/A3n23.pdf |dead-url=no }}</ref> : <math>\Pr(K=k) = \sum\limits_{A\in F_k} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c} (1-p_j) </math> 其中<math>F_k</math>是 {1,2,3,..., ''n'' } 的全體''k''元子集的集合。例如,如果''n'' = 3,那么<math>F_2=\left\{ \{1,2\},\{1,3\},\{2,3\} \right\}</math>。<math>A^c</math>是<math>A</math>的[[补集]],也就是<math>A^c =\{1,2,3,\dots,n\}\setminus A</math>。 <math>F_k</math>将包含<math>n!/((n-k)!k!)</math>個元素,因此上述总和在實務中是很難計算的,除非试验次数''n''很小(例如,如果''n'' = 30,<math>F_{15}</math>包含超过10<sup>20</sup>个元素)。然而,还有其他更有效的方法可以计算<math>\Pr(K=k)</math>。 只要成功機率都不等于 1,就可以使用递归公式计算出''k''次成功的機率:<ref> {{Cite journal |last=Shah |first=B. K. |year=1994 |title=On the distribution of the sum of independent integer valued random variables |journal=American Statistician |volume=27 |issue=3 |page=123–124 |jstor=2683639}} </ref><ref>{{Cite journal |last=Chen |first=X. H. |last2=A. P. Dempster |last3=J. S. Liu |year=1994 |title=Weighted finite population sampling to maximize entropy |url=http://www.people.fas.harvard.edu/~junliu/TechRept/94folder/cdl94.pdf |journal=Biometrika |volume=81 |issue=3 |page=457 |doi=10.1093/biomet/81.3.457 |access-date=2023-07-29 |archive-date=2022-01-07 |archive-url=https://web.archive.org/web/20220107130352/http://www.people.fas.harvard.edu/~junliu/TechRept/94folder/cdl94.pdf |dead-url=no }}</ref> : <math>\Pr (K=k)= \begin{cases} \prod\limits_{i=1}^n (1-p_i) & k=0 \\ \frac{1}{k} \sum\limits_{i=1}^k (-1)^{i-1}\Pr (K=k-i)T(i) & k>0 \\ \end{cases} </math> 其中 : <math> T(i)=\sum\limits_{j=1}^n \left( \frac{p_j}{1-p_j} \right)^i.</math> 递归公式在[[数值稳定性|数值上不稳定]],在<math>n</math>约大于20時应避免使用。另一种方法是使用[[分治法|分治算法]]:假设<math>n = 2^b</math>是2的幂,並以<math>f(p_{i:j})</math>表示成功概率為<math>p_i, \dots, p_j</math>的卜瓦松二项分布,<math>*</math>表示[[卷积]],則<math>f(p_{1:2^b}) = f(p_{1:2^{b-1}})*f(p_{2^{b-1}+1:2^b})</math>。 另一种可能性是使用[[离散傅里叶变换|离散傅立叶变换]]。 <ref> {{Cite journal |last=Fernandez |first=M. |last2=S. Williams |year=2010 |title=Closed-Form Expression for the Poisson-Binomial Probability Density Function |journal=IEEE Transactions on Aerospace and Electronic Systems |volume=46 |issue=2 |page=803–817 |bibcode=2010ITAES..46..803F |doi=10.1109/TAES.2010.5461658 |s2cid=1456258}} </ref> : <math>\Pr (K=k)=\frac{1}{n+1} \sum\limits_{l=0}^n C^{-lk} \prod\limits_{m=1}^n \left( 1+(C^l-1) p_m \right) </math> 其中<math>C=\exp \left( \frac{2i\pi }{n+1} \right)</math>,<math>i=\sqrt{-1}</math>。 Chen和Liu在“卜瓦松二项式和条件伯努利分布的统计应用”中描述了其他方法。 <ref>{{Cite journal |last=Chen |first=S. X. |last2=J. S. Liu |year=1997 |title=Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions |url=http://www3.stat.sinica.edu.tw/statistica/password.asp?vol=7&num=4&art=4 |journal=Statistica Sinica |volume=7 |page=875–892}}</ref> == 特性 == === 均值和方差 === 由于卜瓦松二项式分布變數是''n''个独立伯努利分布變數的总和,因此其均值和方差将是''n''个伯努利分布的均值和方差之和: : <math>\mu = \sum\limits_{i=1}^n p_i</math> : <math>\sigma^2 =\sum\limits_{i=1}^n (1-p_i) p_i</math> 當平均值(<math>\mu</math>)和次數(''n'')為定值,且所有成功機率相等時,我们會得到二项式分布,變異數此時最大。当平均值固定时,變異數的上界為具有相同均值的[[卜瓦松分布]]的變異數,該上界在''n''趋于无穷大時可以渐近取得。{{Citation needed|date=July 2019}} === 熵 === 卜瓦松二項式分佈的[[熵 (信息论)|熵]]沒有簡單的公式,但熵的上限是具有相同數字參數和相同均值的二項式分佈的熵。因此,熵也不大於相同均值的卜瓦松分佈的熵。 謝普-奧爾金凹性猜想由{{le|勞倫斯·謝普|Lawrence Shepp}}和{{le|英格拉姆·奧爾金|Ingram Olkin}}於1981年提出,指出卜瓦松二項式分佈的熵是成功機率<math>p_1, p_2, \dots , p_n</math>的凹函數。這個猜想由 Erwan Hillion 和 Oliver Johnson 於2015年證明。1981年同一篇論文亦提出謝普-奧爾金單調性猜想:若<math>p_i \leq 1/2</math>,則熵對<math>p_i</math>為單調遞增。這個猜想也被 Hillion 和 Johnson 於 2019 年證明。 == 參考資料 == <references /> [[Category:阶乘与二项式主题]] [[Category:离散分布]]
该页面使用的模板:
Template:Citation needed
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Infobox 機率分佈
(
查看源代码
)
Template:Le
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
返回
卜瓦松二項分布
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息