紹爾-謝拉赫引理

来自testwiki
imported>HTinC232022年11月4日 (五) 22:21的版本 (mr號)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索
紹爾-謝拉赫引理,經帕约尔推廣的版本:對於每個有限族(綠色),都存在同樣多個集合組成的另一族(藍色),使得藍色族中每個集合,都被綠色族「Template:Le」。

组合数学Template:Link-en中,紹爾-謝拉赫引理Template:Lang-en)斷言,若集合族VC维低,則該族不能有太多個集合。引理得名於諾貝特·紹爾[1]Template:Link-en[2],兩人分別獨立於1972年發表此結果。Template:註較之略早,在1971年,弗拉基米尔·瓦普尼克亞歷克塞·澤范蘭傑斯合著的論文[3]已有此結果(「VC維」即以兩人為名)。謝拉赫發表引理時,亦歸功於Template:Link-en,故引理又稱為佩爾萊斯-紹爾-謝拉赫引理[4]

布萨格洛等人稱其為「關於VC維的最根本結論之一」[4]。引理在若干方面有應用,就各發現者的研究動機而言,紹爾是研究集族的組合學,謝拉赫研究模型论,VC二氏則研究统计学。後來,引理亦用於离散几何[5]图论[6]

定義及敍述

={S1,S2,}為一族集合,T為另一集,此時所謂TTemplate:Le,意思是T的每個子集(包括空集T本身),皆可表示成T與該族某集之交TSi的VC維是其打碎的最大集的大小

利用以上術語,紹爾-謝拉赫引理可以寫成:

是一族集合,且各集合中,合共衹有n個不同元素,但 ||>i=0k1(ni),則打碎某個k元集合。

所以,若的VC維為k(故不打碎任何k+1元集),則中至多衹有i=0k(ni)=O(nk)個集合。

引理所給的界已是最優:考慮n元集{1,2,,n}中,所有小於k個元素的子集,所成的族。該族的大小恰為i=0k1(ni),但是不打碎任何k元集。[7]

打碎多少集合

帕约尔將紹爾-謝拉赫引理加強為:Template:Refn

有限族必打碎至少||個集合。

紹爾-謝拉赫引理為其直接推論,因為n元全集的子集中,衹有i=0k1(ni)個的元素個數小於k。故||>i=0k1(ni)時,即使全部小集皆已打碎,仍不足||個,故必有打碎某個不少於k元的集合。

亦可將「碎裂」的概念加以限縮,變成「順序碎裂」(Template:Lang)。此時,任意集族順序打碎的集合數,必恰好等於該族的大小。[8]

紹爾-謝拉赫引理的帕約爾變式可使用数学归纳法證明,此證法一說出自諾加·阿隆[9],一說出自Template:Link-en及朗·霍爾茲曼(Template:Lang[8]

作為歸納法的起始步驟,單一個集合組成的族,能打碎空集,已足||個。

至於遞推步驟,可假設引理對任意少於||個集合組成的族皆成立,且族有至少兩個集合,故可選取元素x為其一的元素,但不屬於另一集。如此便可將的集合分成兩類:包含x的集合歸入子族1,不含x的則歸入0

由歸納假設,兩子族各自打碎的集合數,其和至少為|0|+|1|=||

該些碎裂集不能有元素x,因為若要打碎某個有x的集合A,則族中需要有含x的集合,也需要有不含x的集合,纔能使該族各集與A的交集出齊A的全體子集。

若集S衹被一個子族打碎,則數算兩子族打碎的集合時,S計為一個,數打碎的集合時亦計為一個。但S也可能同時被兩子族打碎,如此,數算兩子族打碎的集合時,會將S計兩次;不過既打碎S,也打碎S{x},所以S(和S{x})在數打碎的集合時,也計為兩次。由此,打碎的集合數,不小於兩子族各自打碎集合數之和,從而不小於||

紹爾-謝拉赫引理的原始形式還有另一種證明,利用线性代数容斥原理,該證法由Template:Link-enTemplate:Link-en給出。[5][7]

應用

VC二氏原先將引理應用於證明,若考慮一族VC維固定的事件,則衹需有限多個取樣點,即可近似任意的概率分佈(使取樣所得的事件概率近似該分佈下的事件概率),且取樣點的個數衹取決於VC維數。具體而言,有兩種意義下的近似,各由參數ε定義:

  1. 取樣集S上的概率分佈定義為原分佈的「ε近似」(Template:Lang-en),意思是每個事件被S以該分佈取樣的概率,與原概率所差不過ε
  2. 取樣集S(不設權重)定義為「Template:Link-en」,意思是概率不小於ε的任一事件中,必含S中至少一點。

由定義,ε近似必為ε網,反之則不一定。

VC二氏以此引理證明,若某集族的VC維為d,則必有大小不過O(dε2logdε)ε近似。其後,Template:Harvtxt[10]Template:Harvtxt[11]等發表了類似的結果,證明必存在大小為O(dεlog1ε)ε網,具體上界為dεln1ε+2dεlnln1ε+6dε[5]證明存在小ε網的主要方法是,先揀選O(dεlog1ε)個點的隨機樣本x,再獨立揀選另O(dεlog21ε)個點的隨機樣本y,然後證明以下的不等式:存在某個較大事件Ex不交的概率p1,與存在同樣的事件,且該事件與y相交點數大於中位值的概率p2,兩概率之比至多為2。若固定Exy,則x不交EyE相交點數多於中位值的概率很小。由紹爾-謝拉赫引理,Exy的交集的可能情況並不太多,計算「存在E滿足條件」的概率時,衹需對每種交集的可能性考慮一個E,因此由併集上界,可得p12p2<1,故x有非零概率為ε網。[5]

以上論證說明隨機取樣足夠多個點就可能是ε網。此性質以及ε網、ε近似兩概念本身,皆在机器学习Template:Link-en方面有應用。[12]计算几何方面的應用則有Template:Link-en[10]Template:Le[13]近似算法[14][15]

Template:Harvtxt利用紹爾-謝拉赫引理的推廣,證明若干圖論結果,例如:圖的Template:Link-enTemplate:註方案數介於其連通子圖數與Template:Le子圖數之間。[6]

Template:備註表

參考文獻

Template:Reflist