查看“︁可辨识性”︁的源代码
←
可辨识性
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{roughtranslation|time=2019-05-16T12:33:01+00:00}} {{lead section|time=2019-05-16T10:38:04+00:00}} 在 [[统计学|统计学中]],'''可辨识'''是一个能够更为准确[[推論統計學|推断]]的[[概率模型|模型]]必须满足的属性。 一个模型是'''可辨识的''',如果它在理论上能通过无限的观测结果学习到的真正该模型背后参数的真实值。 在数学上,这相当于说基于这些观测结果的不同的参数值必须产生不同的[[概率分布]]。 通常情况下,模型只是在某些情况下是可识别的,这些情况的限定条件被称为'''识别条件'''。 一个模型是'''不可识别的''',如果:两个或两个以上的参数化是观察等价的。 在某些情况下,即使一个模型是不可识别的,它仍然可能学习到某些特定模型参数子集的真实值。 在这种情况下,我们称该模型是'''部分地可识别'''的。 在其他情况下,模型可能可以学习到参数空间中一定有限区域的真的参数值,在这种情况下,该模型是集合可识别的。 除了严格的理论探索模型的属性,当使用可识别性分析使用实验数据集检验模型时,'''可识别性'''可以在一个更宽泛的范围内被提及。<ref> {{Cite journal|title=Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood|url=http://bioinformatics.oxfordjournals.org/cgi/doi/10.1093/bioinformatics/btp358|last=Raue|first=A.|last2=Kreutz|first2=C.|date=2009-08-01|journal=Bioinformatics|issue=15|doi=10.1093/bioinformatics/btp358|volume=25|pages=1923–1929|pmid=19505944|last3=Maiwald|first3=T.|last4=Bachmann|first4=J.|last5=Schilling|first5=M.|last6=Klingmuller|first6=U.|last7=Timmer|first7=J.}}</ref> == 定义 == 令 <math> \mathcal{P}=\{P_\theta:\theta\in\Theta\} </math> 为一个 [[概率模型|统计模型,]] 其中参数空间 <math>\Theta</math> 可以是有限或无限维。 我们说 <math>\mathcal{P}</math> 是'''可识别的''',如果映射 <math>\theta\mapsto P_\theta</math> 是 [[双射|一一映射]]:<ref>{{Harvnb|Lehmann|Casella|1998}}</ref> 这个定义意味着不同值的 ''θ'' 应当对应于不同的概率分布:如果 ''θ''<sub>1</sub>≠''θ''<sub>2</sub>,那么也有 ''P''<sub>''θ''<sub>1</sub></sub>≠''P''<sub>''θ''<sub>2</sub></sub>。<ref>{{Harvnb|van der Vaart|1998}}</ref> 如果分布是以[[機率密度函數|概率密度的函数]](pdf)方式定义的,那么这两个概率密度函数只有在它们对于一个非零测度集合表现不同时被认为是不同的(例如两个函数ƒ<sub>1</sub>(''x'') = '''1'''<sub>0 ≤ ''x'' < 1</sub>和ƒ<sub>2</sub>(''x'') = '''1'''<sub>0 ≤ ''x'' ≤ 1</sub> 不同之处仅在一个单一点 ''x'' = 1—一个[[勒贝格测度|测度]]为零的集合--因此不能被视为不同的概率密度函数)。 模型的可辨识性在映射 <math>\theta\mapsto P_\theta</math>的可逆性的意义上等价于能够在模型无限长的观察后学习模型的真实的参数值。事实上,如果{''X<sub>t</sub>''} ⊆ ''S'' 是模型的观测序列,那么根据[[大数定律]], : <math> \frac 1 T \sum_{t=1}^T \mathbf{1}_{\{X_t\in A\}} \ \xrightarrow{\text{a.s.}}\ \Pr[X_t\in A], </math> 对于每个可测量的集合''A'' ⊆ ''S'' (此处'''1''' <sub>{...}</sub>是[[指示函数]] )。 因此,通过无限数量的观察,我们将能够在模型中找到真实概率分布''P'' <sub>0</sub> ,并且由于上述可识别性条件需要映射<math>\theta\mapsto P_\theta</math>是可逆的,我们也能够找到产生给定分布''P'' <sub>0</sub> 的真实参数值。 == 例子 == === 例1 === 令 <math>\mathcal{P}</math> 是[[正态分布|正态]]位置尺度族: : <math> \mathcal{P} = \Big\{\ f_\theta(x) = \tfrac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{1}{2\sigma^2}(x-\mu)^2 }\ \Big|\ \theta=(\mu,\sigma): \mu\in\mathbb{R}, \,\sigma\!>0 \ \Big\}. </math> 那么 : <math> \begin{align} & f_{\theta_1}=f_{\theta_2} \\[6pt] \Longleftrightarrow {} & \frac 1 {\sqrt{2\pi}\sigma_1} \exp\left( -\frac 1 {2\sigma_1^2} (x-\mu_1)^2 \right) = \frac 1 {\sqrt{2\pi}\sigma_2} \exp\left( -\frac 1 {2\sigma_2^2}(x-\mu_2)^2 \right) \\[6pt] \Longleftrightarrow {} & \frac 1 {\sigma_1^2}(x-\mu_1)^2 + \ln \sigma_1 = \frac 1 {\sigma_2^2}(x-\mu_2)^2 + \ln \sigma_2 \\[6pt] \Longleftrightarrow {} & x^2 \left(\frac 1 {\sigma_1^2}-\frac 1 {\sigma_2^2}\right) - 2x\left(\frac{\mu_1}{\sigma_1^2}-\frac{\mu_2}{\sigma_2^2} \right) + \left(\frac{\mu_1^2}{\sigma_1^2}-\frac{\mu_2^2}{\sigma_2^2}+\ln\sigma_1-\ln\sigma_2\right) = 0 \end{align} </math> 对于几乎所有的 ''x'' 只有当其所有系数都等于零,该公式为零,唯一可能的情况是|''σ''<sub>1</sub>|=|''σ''<sub>2</sub>|且 ''μ''<sub>1</sub> = ''μ''<sub>2</sub>。 由于在尺度参数 ''σ'' 是限制大于零的,我们得出结论,该模型是可辨识的:ƒ<sub>''θ''1</sub> = ƒ<sub>''θ''2</sub> ⇔ ''θ''<sub>1</sub> = ''θ''<sub>2</sub>。 === 例2 === 令 <math>\mathcal{P}</math> 为标准 [[線性回歸|线性回归模型]]: : <math> y = \beta'x + \varepsilon, \quad \mathrm{E}[\,\varepsilon\mid x\,]=0 </math> (其中,'表示矩阵[[转置矩阵|转置]])。 参数 ''β'' 是可辨识的,当且仅当矩阵 <math> \mathrm{E}[xx'] </math> 是可逆的。 因此,这是该模型的'''可辨识条件'''。 === 例3 === 假设 <math>\mathcal{P}</math> 是经典的变量误差线性模型: : <math>\begin{cases} y = \beta x^* + \varepsilon, \\ x = x^* + \eta, \end{cases}</math> 其中,(''ε'',''η'',''x*'') 是联合正态独立随机变量,其期望为零,方差未知,只有变量(''x'',''y'')是观察到的。 那么这个模型是不可识别的,<ref name="riersol">{{Harvnb|Reiersøl|1950}}</ref> 只有积βσ2<sub style="position:relative;left:-.5em">∗</sub> (其中σ²<sub style="position:relative;left:-.5em">∗</sub>是差异的潜在回归量 ''x*'')。这也是一个集合可识别的模式的例子:虽然确切的 ''β'' 值无法被学习到,我们可以保证,它一定在 (''β''<sub>y</sub>,1÷''β''<sub>x-y</sub>) 区间中的某处,其中, ''β''<sub>yx</sub> 是y关于''x'' 的普通最小二乘法 回归的系数,并且 ''β''<sub>xy</sub> 也是 ''x'' 关于 ''y'' 的普通最小二乘法回归的系数。<ref>{{Harvnb|Casella|Berger|2001}}</ref> 如果我们放弃正态假设并且要求 ''x*'' '''不是'''正态分布,仅保留独立的条件 ''ε'' ⊥ ''η'' ⊥ ''x*'',那么该模型成为可以识别的。<ref name="riersol">{{Harvnb|Reiersøl|1950}}</ref> == 软件 == 在可部分地观察的动力系统的参数估计情况下, [[似然函数]]也可以被用于结构性和实际可识别性分析。<ref>{{Citation|last=Raue|first=A|title=Structural and practical identifiability analysis of partially observed dynamical models by exploiting the profile likelihood|url=http://bioinformatics.oxfordjournals.org/cgi/content/abstract/btp358?ijkey=iYp4jPP50F5vdX0&keytype=ref|journal=Bioinformatics|year=2009|doi=10.1093/bioinformatics/btp358|pmid=19505944|last2=Kreutz|first2=C|last3=Maiwald|first3=T|last4=Bachmann|first4=J|last5=Schilling|first5=M|last6=Klingmüller|first6=U|last7=Timmer|first7=J|volume=25|number=15|pages=1923–9|postscript=.|deadurl=yes|archiveurl=https://archive.today/20130113035515/http://bioinformatics.oxfordjournals.org/cgi/content/abstract/btp358?ijkey=iYp4jPP50F5vdX0&keytype=ref|archivedate=2013-01-13|accessdate=2019-05-16}}</ref> 关于 [http://www.fdmold.uni-freiburg.de/~araue/pmwiki.php/Projects/ProfileLikelihoodApproach] {{Wayback|url=http://www.fdmold.uni-freiburg.de/~araue/pmwiki.php/Projects/ProfileLikelihoodApproach |date=20190812012402 }}的一个实现可以在MATLAB工具箱 PottersWheel中获取。 == 参考 == * [[可觀測性]] * [[系統識別]] == 参考文献 == === 引文 === {{Reflist}} === 来源 === {{refbegin}} * {{Citation|last1=Casella|first1=George|author1-link=George Casella|last2=Berger|first2=Roger L.|title=Statistical Inference|year=2002|edition=2nd|isbn=0-534-24312-6|ref=CITEREFCasellaBerger2002|lccn=2001025794}} * {{Citation|last=Hsiao|first=Cheng|title=Identification|year=1983|series=Handbook of Econometrics, Vol. 1, Ch.4|publisher=[[North-Holland Publishing Company]]}} * {{Citation|last1=Lehmann|first1=E. L.|author1-link=Erich Leo Lehmann|last2=Casella|first2=G.|title=Theory of Point Estimation|edition=2nd|year=1998|publisher=Springer|isbn=0-387-98502-6|ref=CITEREFLehmannCasella1998}} * {{Citation|last=Reiersøl|first=Olav|year=1950|title=Identifiability of a linear relation between variables which are subject to error|journal=[[Econometrica]]|volume=18|issue=4|pages=375–389|jstor=1907835|doi=10.2307/1907835}} * {{Citation|last=van der Vaart|first=A. W.|title=Asymptotic Statistics|year=1998|publisher=[[Cambridge University Press]]|isbn=978-0-521-49603-2|ref=CITEREFvan_der_Vaart1998}} {{refend}} == 进一步阅读 == * {{Citation|first=É.|last=Walter|author-link=Eric Walter|first2=L.|last2=Pronzato|title=Identification of Parametric Models from Experimental Data|year=1997|publisher=Springer}} [[Category:估计理论]]
该页面使用的模板:
Template:Citation
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Harvnb
(
查看源代码
)
Template:Lead section
(
查看源代码
)
Template:Refbegin
(
查看源代码
)
Template:Refend
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Roughtranslation
(
查看源代码
)
Template:Wayback
(
查看源代码
)
返回
可辨识性
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息