查看“︁非线性回归”︁的源代码
←
非线性回归
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{多個問題| {{roughtranslation|time=2019-03-27T14:46:16+00:00}} {{lead section|time=2019-03-27T12:46:46+00:00}} {{refimprove|time=2019-03-27T12:46:46+00:00}} }} {{noteTA |T=zh-tw:非線性迴歸;zh-cn:非线性回归; |G1=Math |1=zh-hant:回歸;zh-tw:迴歸;zh-cn:回归; |2=zh-tw:偏誤;zh-cn:偏差 |3=zh-hant:變量;zh-tw:變數;zh-cn:变量; }} [[File:Michaelis-Menten_saturation_curve_of_an_enzyme_reaction.svg|缩略图|300x300像素| [[米-门二氏动力学]] 的详细信息图像 ]] 在统计学中, '''非线性回归'''是[[迴歸分析|回归分析]]的一种形式,其中观测数据由函数建模,该函数是模型参数的非线性组合并且取决于一个或多个独立变量。 通过逐次逼近的方法拟合数据。 == 一般 == 在非线性回归中,形式的[[概率模型|统计模型]] , : <math> \mathbf{y} \sim f(\mathbf{x}, \boldsymbol\beta)</math> 关联[[自变量和因变量|自变量]] '''x'''的向量及其相关的观察到的[[自变量和因变量|因变量]] '''y''' 。函数''f''在参数''β''的矢量的分量中是非线性的,但在其他方面是任意的。例如,酶动力学的[[米-门二氏动力学]]模型有两个参数和一个独立变量,由''f''相关: {{efn|This model can also be expressed in the conventional biological notation: :<math> v = \frac{V_\max\ [\mbox{S}]}{K_m + [\mbox{S}]} </math>}} : <math> f(x,\boldsymbol\beta)= \frac{\beta_1 x}{\beta_2 + x} </math> 此函数是非线性的,因为它不能表示为两个 <math>\beta</math> 的[[线性组合]]。 [[测量误差|系统误差]]可能存在于自变量中,但其处理不在回归分析的范围内。 如果自变量不是无差错的,那么这是一个变量误差模型 ,也在此范围之外。 非线性函数的其他示例包括[[指数函数]] , 对数函数 , [[三角函数]] , [[冪|幂函数]] , [[高斯函数]]和[[劳伦茨曲线|洛伦兹曲线]] 。 某些函数(如指数函数或对数函数)可以进行转换,以使它们是线性的。 如此转换,可以执行标准线性回归,但必须谨慎应用。 有关详细信息,请参阅下面的线性化§Transformation 。 通常,对于最佳拟合参数,没有闭合形式表达式,如[[線性回歸|线性回归]] 中所示。 通常应用数值[[最优化|优化]]算法来确定最佳拟合参数。 与线性回归相比,可能存在要优化的函数的许多[[极值|局部最小值]] ,甚至全局最小值也可能产生[[估计量的偏差|偏差]]估计。 在实践中,结合优化算法使用参数的估计值来尝试找到平方和的全局最小值。 == 回归统计 == 这个过程的基本假设是模型可以用线性函数近似,即一阶[[泰勒级数]] : :<math>f(x_i,\boldsymbol\beta) \approx f(x_i,0) + \sum_j J_{ij} \beta_j</math> 其中<math>J_{ij} = \frac{\partial f(x_i,\boldsymbol\beta)}{\partial \beta_j}</math> ,由此得出最小二乘估计量由下式给出 . :<math>\hat{\boldsymbol{\beta}} \approx \mathbf { (J^TJ)^{-1}J^Ty}.</math> 计算非线性回归统计量并将其用作线性回归统计量,但在公式中使用'''J'''代替'''X.''' 线性近似将偏差引入统计中。 因此,在解释从非线性模型得到的统计数据时,需要比平常更多的谨慎。 == 普通和加权最小二乘法 == 最佳拟合曲线通常假定应该看起来平方的总和最小化[[误差|残差]] 。 这是普通的最小二乘 (OLS)方法。 然而,在因变量不具有恒定方差的情况下,可以最小化加权平方残差的总和;看加权最小二乘法 。 理想情况下,每个权重应等于观察方差的倒数,但是在迭代加权最小二乘算法中,可以在每次迭代时重新计算权重。 == 线性化 == === 转型 === 通过模型公式的适当变换,可以将一些非线性回归问题移动到线性域。 例如,考虑非线性回归问题 :<math> y = a e^{b x}U \,\!</math> 带有参数''a''和''b''以及乘法误差项''U.''如果我们采用双方的对数,那就变成了 :<math> \ln{(y)} = \ln{(a)} + b x + u, \,\!</math> 其中''u'' = ln( ''U'' ),建议通过''x''上的ln( ''y'' )的线性回归估计未知参数,该计算不需要迭代优化。 但是,使用非线性变换需要谨慎。 数据值的影响将发生变化,模型的误差结构和任何推论结果的解释也将发生变化。 这些可能不是期望的效果。 另一方面,取决于最大误差源是什么,非线性变换可以以高斯方式分布误差,因此必须通过建模考虑来选择执行非线性变换。 对于[[米-门二氏动力学]] ,线性[[双倒数图]] :<math> \frac{1}{v} = \frac{1}{V_\max} + \frac{K_m}{V_{\max}[S]}</math> 1 / ''v''对1 / [ ''S'' ]已被大量使用。 但是,由于它对数据错误非常敏感,并且强烈偏向于将数据拟合到自变量[ ''S'' ]的特定范围内,因此强烈建议不要使用它。 对于属于指数族的误差分布,可以使用链接函数来变换[[廣義線性模型|广义线性模型]]框架下的参数。 === 分割 === [[File:MUSTARD.JPG|右|缩略图|175x175像素| 芥菜和土壤盐分的产量 ]] [[自变量和因变量|''独立''或''解释变量'']] (比如X)可以分成类或段,并且可以对每个段执行[[線性回歸|线性回归]] 。 具有[[置信区间|置信度分析的]]分段回归可以产生[[自变量和因变量|''依赖''或''响应''变量]] (假设Y)在各个段中表现不同的结果。 <ref> RJOosterbaan,1994,频率和回归分析。在:HPRitzema(ed。),Drainage Principles and Applications,Publ。 16,pp.175-224,国际土地复垦与改良研究所(ILRI),荷兰瓦赫宁根。 </ref> 该图显示[[土壤鹽化|土壤盐度]] (X)最初对芥菜的作物产量 (Y)没有影响,直到''临界'' ''值''或''阈''值( ''断点'' ),之后产量受到负面影响。 <ref>RJOosterbaan,2002年。农民田间的排水研究:数据分析。国际土地复垦与改良研究所(ILRI)项目“液体黄金”的一部分,荷兰瓦赫宁根。以PDF格式下载 : [http://www.waterlog.info/pdf/analysis.pdf] {{Wayback|url=http://www.waterlog.info/pdf/analysis.pdf |date=20110722011948 }} 。这个数字是用[[SegReg]]程序制作的,可以从[http://www.waterlog.info/segreg.htm] {{Wayback|url=http://www.waterlog.info/segreg.htm |date=20100213094246 }}免费下载。</ref> == 参见 == {{div col|2}} * [[方差分析]] * [[安斯库姆四重奏]] * [[横截面回归]] * [[曲线拟合]] * [[经验贝叶斯方法]] * [[逻辑斯蒂回归]] * [[M估计]] * [[非参数回归]] * [[多元自适应回归样条]] * [[Lack-of-fit sum of squares]]<!--没有什么好的译名--> * [[截断回归模型]] * [[删失回归模型]] * [[简单线性回归]] * [[分段回归|分段线性回归]] * [[非线性最小二乘法 ]] * [[曲線擬合|曲线拟合]] * [[廣義線性模型|广义线性模型]] * [[局部回归]] {{div col end}} == 参考文献 == {{reflist}} ==脚注== <references group="lower-alpha" responsive=""></references> ==拓展阅读== * {{Cite book|first=R. M.|last=Bethea|first2=B. S.|last2=Duran|first3=T. L.|last3=Boullion|title=Statistical Methods for Engineers and Scientists|url=https://archive.org/details/statisticalmetho0000beth_a4x9|location=New York|publisher=Marcel Dekker|year=1985|isbn=0-8247-7227-X}} * {{Cite journal|title=Prediction Intervals for Growth Curve Forecasts|last=Meade|first=N.|last2=Islam|first2=T.|journal=Journal of Forecasting|issue=5|doi=10.1002/for.3980140502|year=1995|volume=14|pages=413–430}} * {{Cite book|first=K.|last=Schittkowski|title=Data Fitting in Dynamical Systems|publisher=Kluwer|location=Boston|year=2002|isbn=1402010796}} * {{Cite book|first=G. A. F.|last=Seber|first2=C. J.|last2=Wild|title=Nonlinear Regression|url=https://archive.org/details/nonlinearregress0000sebe|location=New York|publisher=John Wiley and Sons|year=1989|isbn=0471617601}} [[Category:回归分析]] [[Category:有未审阅翻译的页面]]
该页面使用的模板:
Template:Cite book
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Div col
(
查看源代码
)
Template:Div col end
(
查看源代码
)
Template:Efn
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
Template:多個問題
(
查看源代码
)
返回
非线性回归
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息