查看“︁负二项分布”︁的源代码
←
负二项分布
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |T=zh-tw:負二項式分布;zh-cn:负二项分布 |G1=Math|1=zh-hant:參數;zh-cn:参数;zh-tw:母數|2=zh-hant:負二項分布;zh-tw:負二項式分布;zh-cn:负二项分布 |3= zh-hans:矩; zh-tw:動差;zh-hant:矩 }} {{機率分佈 | intro = 不同來源對负二项分布的定義略有差異:隨機變量的最小可能取值可能是<math>k = 0</math>(僅計失敗的次數,或反之),亦可能是<math>k = r</math>(總次數,不論成敗);參數<math>p</math>可能表示每次試驗成功的概率,也可能表示失敗的概率;試驗的終止條件可能是成功<math>r</math>次或失敗<math>r</math>次。<ref name="DeGrootNB">{{cite book|last = DeGroot| first = Morris H.| author-link = Morris H. DeGroot| title = Probability and Statistics| edition = Second| year = 1986| publisher = Addison-Wesley| isbn = 0-201-11366-X| oclc = 10605205| lccn = 84006269 |pages = 258–259}}</ref> | name =负二项分布 |type =質量 |pdf_image =[[File:Negbinomial.gif|250px]] *紅線是[[平均值]] *綠線是[[標準差]] |cdf_image = |parameters =<math>r > 0\!</math> ([[實數|實]])<br /><math>0<p<1\!</math>(實) |support =<math>k \in \{0,1,2,\ldots\}\!</math> |pdf =<math>\frac{\Gamma(r+k)}{k!\,\Gamma(r)}\,p^r\,(1-p)^k \!</math> |cdf =<math>I_p(r,k+1)</math> |mean =<math>r\,\frac{1-p}{p}\!</math> |median = |mode =<math>\lfloor(r-1)\,(1-p)/p\rfloor\text{ if }r>1</math><br /><math>0\text{ if }r\leq 1</math> |variance =<math>r\,\frac{1-p}{p^2}\!</math> |skewness =<math>\frac{2-p}{\sqrt{r\,(1-p)}}\!</math> |kurtosis =<math>\frac{6}{r} + \frac{p^2}{r\,(1-p)}\!</math> |entropy = |mgf =<math>\left(\frac{p}{1-(1-p) e^t}\right)^r \!</math> |char =<math>\left(\frac{p}{1-(1-p) e^{i\,t}}\right)^r \!</math> }} '''負二項分布'''(Negative binomial distribution)是[[統計學]]上一種描述在一系列独立同分布的伯努利试验中,成功次数达到指定次数(记为<math>r</math>)时失败次数的[[離散概率分布]]。比如,如果我们定义掷骰子随机变量<math>x</math>值为<math>x=1</math>时成功,所有<math>x\neq 1</math>为失败,这时我们反复掷骰子直到1出现3次(成功次数<math>r=3</math>),此时非1数字出现次数的概率分布即为负二项分布。 [[帕斯卡分布]]('''Pascal distribution,'''来自[[布莱兹·帕斯卡]] (Blaise Pascal))和[[波利亚分布]]('''Polya distribution''',又称罐子模型,来自[[喬治·波利亞]] (George Pólya))均是负二项分布的特例。在工程、气候等领域中经常用“负二项分布”或“帕斯卡分布”来描述变量<math>r</math>为整数的情况,而使用“波利亚分布”来描述<math>r</math>取到实数值<math>R</math>的情况。 对于“相关的离散事件”("associated discrete events")的发生,例如龙卷风爆发,相比于[[泊松分布]],波利亚分布由于允许其[[平均值]]和[[方差]]不同,而能够给出更精确的模型。在流行病学中,它已被用于模拟传染病的疾病传播,其中可能的继发感染数量可能因个体和环境而异<ref>e.g. J.O. Lloyd-Smith, S.J. Schreiber, P.E. Kopp, and W.M. Getz (2005), [https://www.nature.com/articles/nature04153 Superspreading and the effect of individual variation on disease emergence], ''[[Nature (journal)|Nature]]'', '''438''', 355–359. {{doi|10.1038/nature04153}}<br />The overdispersion parameter is usually denoted by the letter <math>k</math> in epidemiology, rather than <math>r</math> as here.</ref>。 更一般地说,由于正[[协方差]]项,事件具有正相关的事件导致比独立事件更大的[[方差]]可能是合适的。 “负二项分布”与“二项分布”的区别在于:“二项分布”是固定试验总次数<math>N</math>的独立试验中,成功次数k的分布;而“负二项分布”是所有到r次成功时即终止的独立试验中,失败次数k的分布。 术语“负二项式”可能是因为出现在分布的[[概率质量函数]]公式中的某个[[二项式系数]]可以用负数更简单地写出<ref>{{cite book |last1=Casella |first1=George |last2=Berger |first2=Roger L. |title=Statistical inference |year=2002 |url=https://archive.org/details/statisticalinfer00case_045|url-access=limited |publisher=Thomson Learning |isbn=0-534-24312-6 |page=[https://archive.org/details/statisticalinfer00case_045/page/n59 95] |edition=2nd}}</ref>。 ==定义== 若每次伯努利试验有两种可能的结果,分别为成功或者失败。在每次试验中,成功的概率为<math>p</math>,失败的概率为<math>1-p</math>。反复进行该伯努利试验,直到观察到第<math>r</math>次成功发生。此时试验失败次数''<math> X </math>''的分布即为负二项分布(或称帕斯卡分布),那么: : '''若随机变量<math>\mathit{X}</math>服从参数为<math>\mathit{r}</math>和<math>\mathit{p}</math>的负二项分布,则记为<math>X \sim NB(r,p)</math>.''' 在实际生活中,我们可以使用负二项分布描述某种机器在坏掉前,能够工作的天数的分布。此时,“成功”的事件可以指机器正常工作一天,“失败”的事件可以指机器故障的一天。如果我们使用负二项分布来描述运动员在获取r个奖牌前尝试的次数的分布,此时,“失败”的事件指运动员的一次尝试,“成功”的事件指运动员获取一枚奖牌。如果使用负二项分布来描述掷一枚硬币出现r次正面前,出现硬币反面的次数的分布,“成功”的事件指出现硬币的正面,“失败”的事件指出现硬币的反面。 ==概率质量函数== === 帕斯卡分布 === 當 <math>r</math> 是整數時的負二項分布又稱'''帕斯卡分布''',其[[概率質量函數]]為: <math> f(k; r, p) \equiv \Pr(X = k) = \binom{k+r-1}{r-1} p^r(1-p)^k \quad\text{for }k = 0, 1, 2, \dotsc </math> 其中 <math>k</math> 是失败的次数, <math>r</math> 是成功的次数, <math>p</math> 是事件成功的概率。在负二项分布的概率质量函数中,由于 <math>k+r</math> 次伯努利试验为独立同分布,每个成功 <math>r</math> 次、失败 <math>k</math> 次的事件的概率为<math>p^r(1-p)^k</math>。由于第 <math>r</math> 次成功一定是最后一次试验,所以应该在<math>k+r-1</math>次试验中选择<math>r-1</math>次成功,使用排列组合二项系数获取所有可能的选择数。 ==== 二项系数与负二项名称来源 ==== 括号中为[[二項式係數|二项式系数]]表达式: : <math> \binom{k+r-1}{r-1} = \frac{(k+r-1)!}{k!\,(r-1)!} = \frac{(k+r-1)(k+r-2)\dotsm(r)}{k!} </math> 该表达式可以写成带负值参数的二项系数的形式,如下式所示,解释了“负二项”名称的来源: : <math> \begin{align} & \frac{(k+r-1)\dotsm(r)}{k!} \\[6pt] = {}& (-1)^k \frac{(-r)(-r-1)(-r-2)\dotsm(-r-k+1)}{k!} = (-1)^k\binom{-r}{k}. \end{align} </math> ==== 概率质量函数对所有可能k值求和为1 ==== 帕斯卡分布概率质量函数<math>f(k;r,p)</math>对所有可能 <math>k</math> 值求和,一定等于1: <math> \sum_{k=0}^\infty \binom{k+r-1}{k}p^r q^k = 1 </math> 证明如下: <math> 1= p^r p^{-r} = p^r(1-q)^{-r} = p^r\sum_{k=0}^\infty\binom{-r}{k}(-q)^k = p^r\sum_{k=0}^\infty(-1)^k\binom{-r}{k}q^k = \sum_{k=0}^\infty \binom{k+r-1}{k}p^r q^k </math> 其中第三步用到了[[二项序列]]展开。 === 几何分布 === 取<math>r=1</math>,負二項分布等於[[幾何分布]]。其概率質量函數為<math>f(k;1,p) = p \cdot (1-p)^k \!</math>。 ===例子=== 舉例說,若我們擲骰子,擲到一即視為成功。則每次擲骰的成功率是<math>\frac{1}{6}</math>。要擲出三次一,所需的擲骰次數屬於集合{ 3, 4, 5, 6, ... }。擲到三次一的擲骰次數是負二項分布的隨機變數。要在第三次擲骰時,擲到第三次一,則之前兩次都要擲到一,其機率為<math>(\frac{1}{6})^3</math>。注意擲骰是伯努利試驗,之前的結果不影響隨後的結果。 若要在第四次擲骰時,擲到第三次一,則之前三次之中要有剛好兩次擲到一,在三次擲骰中擲到2次1的機率為<math>{3 \choose 3-1}\left({5\over6}\right)\left({1\over6}\right)^2</math>。第四次擲骰要擲到一,所以要將前面的機率再乘<math>\frac{1}{6}</math>:<math>{(1+3)-1 \choose 3-1}\left({1\over6}\right)^3 \left({5\over6}\right)</math>。 == 相关分布 == [[几何分布]](在 { 0, 1, 2, 3, ... } 上)是负二项分布的一个特例,其中 ::<math>\operatorname{Geom}(p) = \operatorname{NB}(1,\, 1-p).\,</math> * 负二项分布是{{le|离散相型分布|Discrete phase-type distribution}}的一个特例。 * 负二项分布是离散[[复合泊松分布]]的一个特例。 ==參見== *[[二項式分布]] *[[幾何分布]] ==参考文献== {{reflist}} {{-}} {{概率分布类型列表|負二項分布}} [[Category:离散分布]] [[Category:阶乘与二项式主题]]
该页面使用的模板:
Template:-
(
查看源代码
)
Template:Cite book
(
查看源代码
)
Template:Doi
(
查看源代码
)
Template:Le
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:概率分布类型列表
(
查看源代码
)
Template:機率分佈
(
查看源代码
)
返回
负二项分布
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息