方差

Template:NoteTA Template:Multiple issues Template:Otheruses Template:各地漢字名

變異數（Template:Lang-en）又稱-{zh-cn: 变异数; zh-hk: 變異數; zh-tw:方差}-^[1]、變方^[2]，在概率论及统计学中，描述的是一个随机变量的离散程度，即一组数字与其平均值之间的距离的度量，是随机变量与其总体均值或样本均值的离差的平方的期望值。方差在统计中有非常核心的地位，其应用领域包括描述统计学、推論統計學、假說檢定、度量拟合优度，以及蒙特卡洛采样。由于科学分析经常涉及统计，方差也是重要的科研工具。方差是標準差的平方、分布的二阶矩，以及随机变量与其自身的协方差，其常用的符号表示有 $σ^{2}$ 、 $s^{2}$ 、 $Var (X)$ 、 $V (X)$ ，以及 $𝕍 (X)$ 。^[3]

方差作为离散度量的优点是，它比其他离散度量（如平均差）更易于代数运算；例如，一组不相关的随机变量和的方差等于它们方差的和。在实际应用中，方差的一个缺点是它与随机变量的单位不同，而標準差则单位相同，这就是计算完成后通常采用标准差来衡量离散程度的原因。

有两个不同的概念都被称为“方差”。一种如上所述，是理论概率分布的方差。而另一种方差是一组观测值的特征。观测值通常是从真实世界的系统中测量的。如果给出系统的所有可能的观测，则它们算出的方差称为总体方差；然而，一般情况下我们只使用总体的一个子集（样本），由此计算出的方差称为样本方差。用样本计算出的方差可认为是对整个总体的方差的估计量。

方差的正平方根称为该随机变量的標準差；方差除以期望值归一化的值叫分散指数；标准差除以平均值归一化的值叫变异系数。

定义

设Template:Mvar为服从分布Template:Mvar的随机变量，如果Template:Math是随机变量Template:Mvar的期望值（均值Template:Math），则随机变量Template:Mvar或者分布Template:Mvar的方差为Template:Mvar的离差平方的期望值：

Var (X) = E [(X - μ)^{2}]

这个定义涵盖了连续、离散，或两者皆非的随机变量。方差亦可視作随机变量与自身的协方差：

Var (X) = Cov (X, X)

方差也等价于生成Template:Mvar的概率分布的二阶累积量。方差的常用的表达有 $Var (X)$ ，有时作 $V (X)$ 或 $𝕍 (X)$ ，也可写作符号 $σ_{X}^{2}$ 或 $σ^{2}$ （读作“sigma方”）。方差的表达式可展开如下：

\begin{matrix} Var (X) & = E [(X - E [X])^{2}] \\ = E [X^{2} - 2 X E [X] + E [X]^{2}] \\ = E [X^{2}] - 2 E [X] E [X] + E [X]^{2} \\ = E [X^{2}] - E [X]^{2} \end{matrix}

也就是说，Template:Mvar的方差等于Template:Mvar平方的均值减去Template:Mvar均值的平方。该等式不应该用于浮点运算，因为如果等式的两个成分大小相似，将会造成灾难性抵消。

离散随机变量

如果随机变量Template:Mvar是具有概率质量函數的离散随机分布 Template:Math，則：

Var (X) = \sum_{i = 1}^{n} p_{i} \cdot (x_{i} - μ)^{2} = \sum_{i = 1}^{n} (p_{i} \cdot x_{i}^{2}) - μ^{2}

此處 $μ$ 是其期望值，即：

μ = \sum_{i = 1}^{n} p_{i} \cdot x_{i} .

$x_{i}$ 表示實現值(realized value)

當Template:Mvar為有Template:Mvar個相等機率值的離散型均勻分佈時：

μ = \frac{1}{n} \sum_{i = 1}^{n} x_{i},

Var (X) = σ^{2} = \frac{1}{n} \sum_{i = 1}^{n} (x_{i} - μ)^{2} = \frac{1}{n} (\sum_{i = 1}^{n} x_{i}^{2} - n μ^{2}) = \frac{\sum_{i = 1}^{n} x_{i}^{2}}{n} - μ^{2} .

Template:Mvar個相等機率值的方差亦可以點對點間的方變量表示為：

Var (X) = \frac{1}{n^{2}} \sum_{i = 1}^{n} \sum_{j = 1}^{n} \frac{1}{2} (x_{i} - x_{j})^{2} .

连续型随机变量

如果随机变量Template:Mvar是連續分布，機率密度函數為Template:Math，相應的累积分布函数為Template:Math，則其方差為：

\begin{matrix} Var (X) = σ^{2} & = \int_{ℝ} (x - μ)^{2} f (x) d x \\ = \int_{ℝ} x^{2} f (x) d x - 2 μ \int_{ℝ} x f (x) d x + μ^{2} \int_{ℝ} f (x) d x \\ = \int_{ℝ} x^{2} d F (x) - 2 μ \int_{ℝ} x d F (x) + μ^{2} \int_{ℝ} d F (x) \\ = \int_{ℝ} x^{2} d F (x) - 2 μ \cdot μ + μ^{2} \cdot 1 \\ = \int_{ℝ} x^{2} d F (x) - μ^{2}, \end{matrix}

或等價地：

Var (X) = \int_{ℝ} x^{2} f (x) d x - μ^{2},

其中 $μ$ 為 $X$ 的期望值，其計算方法如下：

μ = \int_{ℝ} x f (x) d x = \int_{ℝ} x d F (x) .

這些公式中， $d x$ 和 $d F (x)$ 的積分分別為勒貝格積分和Template:Tsl。

若函數 $x^{2} f (x)$ 在每個有限區間 $[a, b] \subset ℝ$ 都是黎曼可積的，則：

Var (X) = \int_{- \infty}^{+ \infty} x^{2} f (x) d x - μ^{2},

該積分為非正常黎曼积分。

常见概率分布

下表列出了一些常用概率分布的方差。

概率分布类型	概率分布函数	均值	方差
二項式分布	$\Pr (X = k) = (\binom{n}{k}) p^{k} (1 - p)^{n - k}$	$n p$	$n p (1 - p)$
幾何分佈	$\Pr (X = k) = (1 - p)^{k - 1} p$	$\frac{1}{p}$	$\frac{(1 - p)}{p^{2}}$
正态分布	$f (x ∣ μ, σ^{2}) = \frac{1}{\sqrt{2 π σ^{2}}} e^{- \frac{(x - μ)^{2}}{2 σ^{2}}}$	$μ$	$σ^{2}$
連續型均勻分布	$f (x ∣ a, b) = {\begin{matrix} \frac{1}{b - a} & for a \leq x \leq b, \\ 0 & for x < a or x > b \end{matrix}$	$\frac{a + b}{2}$	$\frac{(b - a)^{2}}{12}$
指数分布	$f (x ∣ λ) = λ e^{- λ x}$	$\frac{1}{λ}$	$\frac{1}{λ^{2}}$
卜瓦松分布	$f (k ∣ λ) = \frac{e^{- λ} λ^{k}}{k!}$	$λ$	$λ$

特性

方差不會是負的，因為平方運算結果為非負數：

Var (X) \geq 0

一個常數隨機變數的方差為零。反之，若有限個數組成的資料集方差為零，則其內所有數皆相等。對於一般隨機變數，也有類似結論，即方差為零推出該變數幾乎總是取同一個值：

P (X = a) = 1 \Leftrightarrow Var (X) = 0

方差不變於定位參數的變動。也就是說，如果一個常數被加至一個數列中的所有變數值，此數列的方差不會改變：

Var (X + a) = Var (X) .

如果所有數值被放大一個常數倍，方差會放大此常數的平方倍：

Var (a X) = a^{2} Var (X)

兩個隨機變數合的方差為：

Var (a X + b Y) = a^{2} Var (X) + b^{2} Var (Y) + 2 a b Cov (X, Y),

Var (X - Y) = Var (X) + Var (Y) - 2 Cov (X, Y),

此處Template:Math代表共變異數。

對於 $N$ 個隨機變數 ${X_{1}, \dots, X_{N}}$ 的總和：

Var (\sum_{i = 1}^{N} X_{i}) = \sum_{i, j = 1}^{N} Cov (X_{i}, X_{j}) = \sum_{i = 1}^{N} Var (X_{i}) + \sum_{i \neq j} Cov (X_{i}, X_{j})

在样本空间Ω上存在有限期望和方差的随机变量构成一个希尔伯特空间：Template:Math，不过这裡的内积和长度跟协方差，标准差还是不大一样。所以，我们得把这个空间“除”常变量构成的子空间，也就是说把相差一个常数的所有原来那个空间的随机变量做成一个等价类。这还是一个新的无穷维线性空间，并且有一个从旧空间内积诱导出来的新内积，而这个内积就是协方差。

总体方差和样本方差

总体方差

一般而言，一个有限的容量为Template:Mvar、元素的值为Template:Mvar的总体的总体方差为：

\begin{matrix} σ^{2} & = \frac{1}{N} \sum_{i = 1}^{N} {(x_{i} - μ)}^{2} = \frac{1}{N} \sum_{i = 1}^{N} (x_{i}^{2} - 2 μ x_{i} + μ^{2}) \\ = (\frac{1}{N} \sum_{i = 1}^{N} x_{i}^{2}) - 2 μ (\frac{1}{N} \sum_{i = 1}^{N} x_{i}) + μ^{2} \\ = (\frac{1}{N} \sum_{i = 1}^{N} x_{i}^{2}) - μ^{2} \end{matrix}

其中总体均值为：

μ = \frac{1}{N} \sum_{i = 1}^{N} x_{i} .

总体方差也可用下式计算：

σ^{2} = \frac{1}{N^{2}} \sum_{i < j} {(x_{i} - x_{j})}^{2} = \frac{1}{2 N^{2}} \sum_{i, j = 1}^{N} {(x_{i} - x_{j})}^{2} .

该式成立，是因为：

\begin{matrix} \frac{1}{2 N^{2}} \sum_{i, j = 1}^{N} {(x_{i} - x_{j})}^{2} \\ = & \frac{1}{2 N^{2}} \sum_{i, j = 1}^{N} (x_{i}^{2} - 2 x_{i} x_{j} + x_{j}^{2}) \\ = & \frac{1}{2 N} \sum_{j = 1}^{N} (\frac{1}{N} \sum_{i = 1}^{N} x_{i}^{2}) - (\frac{1}{N} \sum_{i = 1}^{N} x_{i}) (\frac{1}{N} \sum_{j = 1}^{N} x_{j}) + \frac{1}{2 N} \sum_{i = 1}^{N} (\frac{1}{N} \sum_{j = 1}^{N} x_{j}^{2}) \\ = & \frac{1}{2} (σ^{2} + μ^{2}) - μ^{2} + \frac{1}{2} (σ^{2} + μ^{2}) \\ = & σ^{2} \end{matrix}

总体方差与生成该总体的概率分布的方差相匹配。因此，“总体”的概念可推广到具有无限总体的连续随机变量。

样本方差

有偏样本方差

在许多实际情况下，总体的真实方差无法事先知道，必须以某种方式计算出来。在面对非常大的总体时，不可能计算总体中的每一个元素，因此必须从总体中抽取样本进行计算。^[4]样本方差还可以应用于用连续分布的样本来估计该分布的方差。

下面我们从总体中有放回抽取 Template:Mvar个数值Template:Math，其中Template:Math，并用该样本来估计总体的方差。^[5]直接使用样本数据的方差，得到的是Template:Tsl的均值：

σ_{Y}^{2} = \frac{1}{n} \sum_{i = 1}^{n} {(Y_{i} - \overline{Y})}^{2} = (\frac{1}{n} \sum_{i = 1}^{n} Y_{i}^{2}) - \overset{2}{\overline{Y}} = \frac{1}{n^{2}} \sum_{i, j : i < j} {(Y_{i} - Y_{j})}^{2} .

此处， $\overline{Y}$ 表示Template:Tsl：

\overline{Y} = \frac{1}{n} \sum_{i = 1}^{n} Y_{i} .

由于Template:Mvar是随机选取的， $\overline{Y}$ 和 $σ_{Y}^{2}$ 都是随机变量。它们的期望值可以用从总体中抽取的所有可能的容量为Template:Mvar的Template:Math的样本集合来估计。对于 $σ_{Y}^{2}$ 即为：

\begin{matrix} E [σ_{Y}^{2}] & = E [\frac{1}{n} \sum_{i = 1}^{n} {(Y_{i} - \frac{1}{n} \sum_{j = 1}^{n} Y_{j})}^{2}] \\ = \frac{1}{n} \sum_{i = 1}^{n} E [Y_{i}^{2} - \frac{2}{n} Y_{i} \sum_{j = 1}^{n} Y_{j} + \frac{1}{n^{2}} \sum_{j = 1}^{n} Y_{j} \sum_{k = 1}^{n} Y_{k}] \\ = \frac{1}{n} \sum_{i = 1}^{n} (\frac{n - 2}{n} E [Y_{i}^{2}] - \frac{2}{n} \sum_{j \neq i} E [Y_{i} Y_{j}] + \frac{1}{n^{2}} \sum_{j = 1}^{n} \sum_{k \neq j}^{n} E [Y_{j} Y_{k}] + \frac{1}{n^{2}} \sum_{j = 1}^{n} E [Y_{j}^{2}]) \\ = \frac{1}{n} \sum_{i = 1}^{n} [\frac{n - 2}{n} (σ^{2} + μ^{2}) - \frac{2}{n} (n - 1) μ^{2} + \frac{1}{n^{2}} n (n - 1) μ^{2} + \frac{1}{n} (σ^{2} + μ^{2})] \\ = \frac{n - 1}{n} σ^{2} . \end{matrix}

因此， $σ_{Y}^{2}$ 给出的是总体方差的有偏估计量，偏差为 $\frac{n - 1}{n}$ 。因此， $σ_{Y}^{2}$ 称为有偏样本方差。

无偏样本方差

将偏差纠正后，可得到无偏样本方差，记为 $s^{2}$ ：

s^{2} = \frac{n}{n - 1} σ_{Y}^{2} = \frac{n}{n - 1} [\frac{1}{n} \sum_{i = 1}^{n} {(Y_{i} - \overline{Y})}^{2}] = \frac{1}{n - 1} \sum_{i = 1}^{n} {(Y_{i} - \overline{Y})}^{2}

当语境明确时，两个估计量都可以简称为“样本方差”。同样的证明也适用于取自连续概率分布的样本。

其中，对Template:Math的使用称为Template:Tsl，它也用于Template:Tsl和样本标准差（方差的平方根）。平方根是一个凹函数，因此会引入负偏差（根据簡森不等式），具体取决于分布，因此校正的样本标准差（使用贝塞尔校正）是有偏的。Template:Tsl是一个技术上复杂的问题，不过对于正态分布，使用Template:Math能得到几乎无偏的估计值。

无偏样本方差是函数Template:Math的U-统计量。

一般化

如果Template:Mvar是一个向量其取值范围在實數空间Template:Mvar，并且其每个元素都是一个一维随机变量，我们就把Template:Mvar称为随机向量。随机向量的方差是一维随机变量方差的自然推广，其定义为Template:Math，其中Template:Math，Template:Math是Template:Mvar的转置。这个方差是一个非负定的方阵，通常称为协方差矩阵。

如果Template:Mvar是一个複數随机变量的向量（向量中每個元素均為複數的隨機變數），那么其方差定义则为Template:Math，其中Template:Math是Template:Mvar的共轭转置向量或稱為埃尔米特向量。根据这个定义，變異數为实数。

历史

「方差」（variance）这个名词率先由羅納德·費雪（Template:Lang-en）在论文《Template:Lang》^[6]中提出。

后来方差逐渐衍生出了「半方差」（semivariance）、「亚方差」（hypo variance）、「超方差」（super variance）、「Template:Link-en」（circular variance）与「倒方差」（inverse variance）等概念。

半方差

半方差的計算方式與方差類似，但是只包括了低於均值的觀測值：

Semivariance = \frac{1}{n} \sum_{i : x_{i} < μ} (x_{i} - μ)^{2}

半方差在不同应用领域也被用作特殊的量度。对于偏态分布，半方差能提供方差所不能提供的额外信息。^[7]

参见

方差类型

参考文献

Template:Reflist

Template:- Template:概率分布理论 Template:统计学

Template:Authority control

↑ Template:Cite web
↑ Template:Cite web
↑ Template:Cite book
↑ Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.
↑ Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York
↑ Ronald Fisher（1918）The correlation between relatives on the supposition of Mendelian Inheritance Template:Wayback
↑ Template:Cite web

[1] Template:Cite web

[2] Template:Cite web

[3] Template:Cite book

[4] Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.

[5] Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York

[6] Ronald Fisher（1918）The correlation between relatives on the supposition of Mendelian Inheritance Template:Wayback

[7] Template:Cite web

[1]

[2]

[3]

[4]

[5]

[6]

[7]

方差

目录

定义

离散随机变量

连续型随机变量

常见概率分布

特性

总体方差和样本方差

总体方差

样本方差

有偏样本方差

无偏样本方差

一般化

历史

半方差

参见

方差类型

参考文献

导航菜单

方差

定义

离散随机变量

连续型随机变量

常见概率分布

特性

总体方差和样本方差

总体方差

样本方差

有偏样本方差

无偏样本方差

一般化

历史

半方差

参见

方差类型

参考文献

导航菜单

搜索