查看“︁戴尔指数”︁的源代码
←
戴尔指数
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
'''戴尔指数'''({{lang-en|Theil Index}})又稱為'''泰爾指數'''<ref name=中国经济发展中>{{Cite book | author = 徐淑娟 | title = 中国经济发展中的行业收入差距问题研究 | location = | publisher = 西南財經大學出版社 | date = 2018-02-01 | pages = 33-34 | ISBN = 7550428530 | accessdate = 2019-01-14 | url = https://books.google.com.tw/books?id=CV1ODwAAQBAJ&pg=PA34&lpg=PA34&dq=%E6%B3%B0%E7%88%BE%E4%BF%82%E6%95%B8&source=bl&ots=_8PpdOS0xJ&sig=c1PZMnd2y4z4NxV0-CjlNqjPFMQ&hl=zh-TW&sa=X&ved=2ahUKEwj7pMbKs-vfAhWMvLwKHZ2HBiIQ6AEwCHoECAIQAQ#v=onepage&q=%E6%B3%B0%E7%88%BE%E4%BF%82%E6%95%B8&f=false | language = zh-cn | quote = | archive-date = 2019-06-05 | archive-url = https://web.archive.org/web/20190605110036/https://books.google.com.tw/books?id=CV1ODwAAQBAJ&pg=PA34&lpg=PA34&dq=%E6%B3%B0%E7%88%BE%E4%BF%82%E6%95%B8&source=bl&ots=_8PpdOS0xJ&sig=c1PZMnd2y4z4NxV0-CjlNqjPFMQ&hl=zh-TW&sa=X&ved=2ahUKEwj7pMbKs-vfAhWMvLwKHZ2HBiIQ6AEwCHoECAIQAQ#v=onepage&q=%E6%B3%B0%E7%88%BE%E4%BF%82%E6%95%B8&f=false | dead-url = no }}</ref>,是一个衡量[[经济不平等]]<ref>{{Cite web | url = http://utip.gov.utexas.edu/papers/utip_14.pdf | title = Introduction to the Theil index from the University of Texas | access-date = 2006-01-15 | archive-url = https://web.archive.org/web/20051118194707/http://utip.gov.utexas.edu/papers/utip_14.pdf | archive-date = 2005-11-18 | dead-url = no }}</ref>的统计量。它也曾經用來衡量其他社會不平等現象,如種族隔離<ref>{{cite news | url = http://geodacenter.asu.edu/node/236 | archiveurl = https://archive.today/20120710143828/https://geodacenter.asu.edu/node/236 | archivedate = 2012-07-10 | title = Diversity and Social Segregation | publisher = geodacenter.asu.edu | accessdate = 2016-03-18 | dead-url = yes }}</ref><ref>{{cite web|title=Segregation Measures|url=https://www.urban.org/research/data-methods/data-analysis/quantitative-data-analysis/segregation-measures|website=www.urban.org|publisher=Urban Institute|accessdate=5 February 2018|language=en|archive-date=2021-01-19|archive-url=https://web.archive.org/web/20210119000227/https://www.urban.org/research/data-methods/data-analysis/quantitative-data-analysis/segregation-measures|dead-url=no}}</ref><ref name="policymap">{{cite web|last1=Parker|first1=Lauren|title=Racial and Ethnic Segregation: In the News and On PolicyMap|url=https://www.policymap.com/2015/07/racial-and-ethnic-segregation-in-the-news-and-on-policymap/|website=PolicyMap|accessdate=5 February 2018|date=20 July 2015|archive-date=2019-06-08|archive-url=https://web.archive.org/web/20190608213517/https://www.policymap.com/2015/07/racial-and-ethnic-segregation-in-the-news-and-on-policymap/|dead-url=no}}</ref>。 戴尔指数主要是利用[[資訊理論]]中的[[熵 (資訊理論)|資訊熵]]的概念導出的。戴尔指数等於[[資訊冗餘]],也就是資料最大可能[[熵 (資訊理論)|資訊熵]]減去觀測到的[[熵 (資訊理論)|資訊熵]],它是{{le|广义熵指数|generalized entropy index}}的特例,可以被視為冗餘度、單樣性、不平等、非隨機性和可壓縮性的度量。<ref name="policymap" /> 戴尔指数最早由[[荷兰]][[鹿特丹伊拉斯姆斯大學]]的[[计量经济学]]家{{le|亨利·戴尔 (经济学家)|Henri Theil|亨利·戴尔}}({{lang|fr|Henri Theil}})所提出。<ref name="policymap" /> ==数学公式== 假設一個人口為''N''的群體,其收入分別為''x''<sub>''i''</sub> (''i'' = 1,...,''N''),則它的戴爾指數''T''定義為<ref name="Formulas">{{Cite web|url=http://www.poorcity.richcity.org|accessdate=2019-01-11|title=Redundancy, Entropy and Inequality Measures|language=en|archive-date=2020-10-23|archive-url=https://web.archive.org/web/20201023210001/http://poorcity.richcity.org/|dead-url=no}}</ref>: : <math> T_T=T_{\alpha=1} = \frac{1}{N}\sum_{i=1}^N \frac{x_i}{\mu} \ln\left(\frac{x_i}{\mu} \right) </math> 而戴爾指數''L''則定義為 : <math> T_L = T_{\alpha=0}=\frac{1}{N}\sum_{i=1}^N \ln\left(\frac{\mu}{x_i}\right) </math> 其中<math>x_i</math>为第<math>i</math>个人的收入,<math>{\mu}</math>为平均收入,<math>N</math>为人口数量。加总符号中的第一项可以理解为个人在总收入中所占的比例,第二项为该个人相对于均值的收入。 如果收入分布是個[[離散分布函數]] ''f''<sub>''k''</sub> (''k'' = 0,...,''W''),其中''f''<sub>''k''</sub>是收入為''k''的人口比例,而''W'' = ''Nμ'' 代表總收入,可以得知 <math>\sum_{k=0}^W f_k=1</math> 。 它的戴爾指數''T''定義為: : <math> T_T=\sum_{k=0}^W\, f_k\, \frac k \mu \ln\left(\frac k \mu \right) </math> 這裡的<math>\mu</math>一樣是收入平均 : <math> \mu=\sum_{k=0}^W k f_k </math> 其中應注意到收入''k''是一個整數,''k=1''代表最小收入增量(比如[[新台幣]]1元)。 如果收入分布是個[[連續分布函數]]''f''(''k''),''k''取值0到[[無窮大|無窮]],其中''f''(''k'') ''dk'' 是收入為''k'' 到 ''k'' + ''dk''的人口數量,那戴爾指數''T''定義為: :<math>T_T=\int_0^\infty f(k) \frac k \mu \ln\left(\frac k \mu \right) dk</math> 其中平均<math>\mu</math>為: : <math> \mu=\int_0^\infty k f(k) \, dk </math> 一些常見連續概率分佈的戴尔指數如下表所示: :{| class="wikitable" style="float: left; margin-left: 1em;" |- ! 收入分布函數 !! PDF(''x'') (''x'' ≥ 0) !! 戴尔指数([[納特]]) |- | [[狄拉克δ函數]] || <math>\delta(x-x_0),\, x_0>0</math> || 0 |- | [[連續型均勻分布]] ||<math>\begin{cases} \frac{1}{b-a} & a\le x\le b \\ 0 & \text{otherwise} \end{cases}</math> || <math>\ln \left( \frac{2a}{(a+b)\sqrt{e}} \right) + \frac{b^2}{b^2-a^2}\ln (b/a) </math> |- | [[指數分布]] ||<math>\lambda e^{-x\lambda},\,\,x>0</math> ||<math>1-</math> [[Euler–Mascheroni constant|<math>\gamma</math>]] |- | [[對數常態分布]] ||<math>\frac{1}{\sigma\sqrt{2\pi}} e^{(-(\ln(x)-\mu)^2)/\sigma^2}</math> ||<math>\frac{\sigma^2}{2}</math> |- | [[帕累托分布]] ||<math>\begin{cases} \frac{\alpha k^\alpha}{x^{\alpha+1}} & x\ge k\\0 & x < k \end{cases}</math> ||<math>\ln(1\!-\!1/\alpha)+\frac{1}{\alpha-1}</math> (α>1) |- | [[卡方分布]] ||<math>\frac{2^{-k/2} e^{-x/2} x^{k/2 - 1}}{\Gamma(k/2)}</math> ||<math>\ln(2/k)+</math> [[Polygamma function|<math>\psi^{(0)}</math>]]<math>(1\!+\!k/2)</math> |- | [[伽瑪分布]] ||<math>\frac{e^{-x/\theta}x^{k-1}\theta^{-k}}{\Gamma(k)}</math> || [[Polygamma function|<math>\psi^{(0)}</math>]]<math>(1+k)-\ln(k)</math> |- | [[韋伯分布]] ||<math>\frac k \lambda \left(\frac {x}{\lambda} \right)^{k-1} e^{-(x/\lambda)^k}</math> ||<math>\frac{1}{k}</math> [[Polygamma function|<math>\psi^{(0)}</math>]]<math>(1+1/k)-\ln\left(\Gamma(1+1/k)\right)</math> |} {{clear}} 如果每一个人都有相同的收入,即等于均值,则指数为零。如果某个个人拥有所有的收入,则指数为<math>\ln{N}</math>。''T''<sub>T</sub> 除以<math>\ln N</math> 可以將方程歸一化到0到1的範圍,但這樣違反{{le|獨立公理|Economic inequality metrics}}: <math>T[x\cup x]\ne T[x]</math>並不符合衡量不平等的標準。 ==信息論推導== 戴尔指数导自[[克勞德·夏農]]的[[夏農熵|信息熵]],他的一般數學形式為: :<math>S = k \sum_{i=1}^N \left( p_i \log{\frac{1}{p_i}} \right) = - k \sum_{i=1}^N \left( p_i \log{p_i} \right)</math> 其中 <math>p_i</math>是從人群裡找到<math>i</math>的機率。<math>k</math>是[[玻爾茲曼常數]]。在信息論中,當信息以二進制數字給出時,<math>k=1</math>並且對數基底為2。在物理學和戴爾指數的計算中,選擇自然對數作為對數基底。當<math>p_i</math>替換成人均收入<math>x_i</math>時,需要除以總收入達到歸一化<math>N\overline{x}</math>。那可以導出,觀察到的信息熵為: : <math>S_\text{Theil} = \sum_{i=1}^N \left( \frac{x_i}{N \overline{x}} \ln{\frac{N \overline{x}}{x_i}} \right)</math> 设<math>T</math>为戴尔指数,<math>S</math>为[[夏農熵]],则有 <math> T=\ln(N)-S </math> 其中,ln(N)是理論最大熵。香濃根据事件发生概率导出的其熵测度。它可以用戴尔系数解释为自某个特定个人处随机取得一块钱的概率。并与其第一项,即总收入中个人所占份额相同。 {| class="wikitable" |- ! 符號 !! 信息論!! 戴爾指數 T<sub>T</sub> |- | <math>N</math> || 字符數 || 人口數 |- | <math>i</math> || 某個特定字符 || 某個特定人 |- | <math>x_i</math> || 第i個字符 character || 第i個人的收入 |- | <math>N\overline{x}</math> || 總字符數 || 總收入 |- | <math>T_T</math> || 未被使用的資訊空間 || 未使用潛在價格機制 |} ==可分解性== 戴尔指数的一个优点是它是某个子群体中不平等的加权和<ref name=中国经济发展中/>。例如,美国国内的不平等就是每个州的不平等的加权和,由该州收入相对于国家总收入的比值来加权。 如果人口被划分为<math>m</math>个子群体,<math>s_k</math> 为群体<math>k</math> 的收入比例,<math>T_k</math>为该子群体的戴尔指数,而 <math>\overline{x}_k</math> 为子群体 <math>k</math>的平均收入,则戴尔指数为 : <math> T = \sum_{k=1}^m s_k T_{T_k} + \sum_{k=1}^m s_k \ln{\frac{\overline{x}_k}{\overline{x}}} </math> 因此,我们可以说某个特定群体给总体“贡献了”一定数量的不平等。 另外一个被广泛使用的不平等度量为[[基尼系数]],该系数对于很多人来说由于基于[[劳伦茨曲线]]而非常直观。但是它却没有戴尔指数容易分解。 ==參考文獻== {{Reflist}} ==外部連結== *[http://utip.gov.utexas.edu/papers/utip_14.pdf 德克萨斯大学戴尔指数简介] {{Wayback|url=http://utip.gov.utexas.edu/papers/utip_14.pdf |date=20051118194707 }}(英文) *試算表: [[收入不平等指标#电子表格计算]] * [https://archive.today/20121204174230/http://www.wessa.net/co.wasp 免費在線計算器] 計算基尼係數,繪製洛倫茲曲線,並為任何數據集計算許多其他濃度測量值 * Free Calculator: [http://www.poorcity.richcity.org/calculator.htm Online] {{Wayback|url=http://www.poorcity.richcity.org/calculator.htm |date=20171109170631 }} and [https://web.archive.org/web/20041012085224/http://luaforge.net/project/showfiles.php?group_id=49 downloadable scripts] ([[Python]] and [[Lua]]) for Atkinson, Gini, and Hoover inequalities * Users of the [http://www.r-project.org/ R] {{Wayback|url=http://www.r-project.org/ |date=20110305165926 }} data analysis software can install the "ineq" package which allows for computation of a variety of inequality indices including Gini, Atkinson, Theil. * [http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19968 MATLAB 不平等包] {{Wayback|url=http://www.mathworks.com/matlabcentral/fileexchange/loadFile.do?objectId=19968 |date=20081004090028 }}。MATLAB不平等包,其中包括用於計算基尼,阿特金森,泰爾指數和標繪洛倫茨曲線的代碼 [[Category:经济指数]] [[Category:计量经济学]] [[Category:福利经济学]]
该页面使用的模板:
Template:Cite book
(
查看源代码
)
Template:Cite news
(
查看源代码
)
Template:Cite web
(
查看源代码
)
Template:Clear
(
查看源代码
)
Template:Lang
(
查看源代码
)
Template:Lang-en
(
查看源代码
)
Template:Le
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
返回
戴尔指数
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息