传输理论

来自testwiki
imported>InternetArchiveBot2025年3月7日 (五) 19:32的版本 (补救5个来源,并将0个来源标记为失效。) #IABot (v2.0.9.5)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

传输理论Template:Lang-enTemplate:Lang),又称为运输理论,是数学、经济学等学科中研究最优运输资源配置的理论。该问题最早由法国数学家加斯帕尔·蒙日于1781年提出。[1]

1920年代,A·N·托尔斯泰是最早运用数学方法研究传输问题的学者之一。1930年,他在苏联国家交通部编纂的《运输规划》第一卷中发表了题为《寻找太空货物运输的最小千公里方法》的论文。[2][3]

第二次世界大战期间,苏联数学家、经济学家列昂尼德·坎托罗维奇在该领域取得了重要进展。[4]因此,这一问题有时也被称为蒙日-坎托罗维奇运输问题Template:Lang)。 [5]该问题的线性规划形式也被称为Template:Le-库普曼斯运输问题。[6]

背景

矿山与工厂

假设有m个开采铁矿石的矿山以及n个工厂使用这些矿山生产的铁矿石,且这些矿山和工厂构成欧几里得平面2中两个不相交子集MF。同时假设存在一个成本函数c:2×2[0,), 其中c(x,y)表示将一批矿石从x运送到y的成本。为简化起见,此处忽略运输所需的时间。我们还假定每个矿山只能供应一家工厂(不能拆分运输),并且每家工厂需要恰好一批货物才能运营(工厂不能半负荷或双倍负荷运转)。基于上述条件,一个传输计划可以看作是一个双射T:MF 。换句话说,每个矿井mM仅供应一个目标工厂T(m)F,而每个工厂也只由一个矿山供货。我们希望找到最优传输计划T,使得总成本

c(T):=mMc(m,T(m))

在所有MF的传输计划中是最小的。该问题是传输问题的一个特例,可看成一个任务分配问题。更具体地说,它等价于在二分图中寻找最小权重匹配。

书籍移动:成本函数的重要性

下面这个简单的例子说明了成本函数在确定最优传输计划中的重要性。假设我们有n本宽度相等的书摆放在书架上(可以看成具像化的实数线),形成连续一排书。我们希望将它们重新排列,在保持其连续性的同时将整体向右移动一本书的宽度。针对这个问题,有两个显而易见的最优传输候选方案:

  1. 将所有n本书全都向右移动一本书的宽度(许多小步);
  2. 将最左侧的书向右移动n书本的宽度,其他书则保持不动(一大步)。

如果成本函数与欧几里得距离成正比(即 c(x,y)=αxy,其中α>0 ),那么这两种候选方案都是最优的。而如果我们选择与欧几里得距离的平方成比例的严格凸成本函数(即 c(x,y)=αxy2,其中α>0 ),则“许多小步”的方案则是唯一的最优解。

需要注意的是,上述成本函数仅考虑书籍本身移动的水平距离,而没有考虑拿起每本书并将其移动到位的设备所行进的水平距离。如果考虑后者,那么在两种传输计划中,第二种方案对于欧几里得距离始终是最优的,而第一种方案则对于平方欧几里得距离是最优的(至少有三本书的情况下)。

希区柯克问题

以下传输问题的表述由弗兰克·劳伦·希区柯克提出:

假设有m个供应源x1,,xm为某一商品供货,且每个供应源xi处有a(xi)个单位的供应量。同时有n个需求点y1,,yn需要该商品,每个需求点yj处有b(yj)个单位的需求。若c(xi, yj)表示从xiyj的单位运输成本,任务是找到一个流量分配方案,在满足供应需求的同时最小化运输成本。这一物流问题由德尔伯特·雷·富尔克森提出[7],并在他与小莱斯特·伦道夫·福特合著的《网络流》(Flows in Networks)(1962年)一书中得到了阐述。[8]

佳林·库普曼斯也为运输经济学与资源分配问题的表述作出了贡献。

问题的抽象表述

蒙日和坎托罗维奇形式

由于黎曼几何测度论的发展,在现代或更加技术性的文献中传输问题的表述有所不同。不过,上述矿山与工厂的简单例子还是可以作为考虑抽象形式时一个有用的参照。此时我们可以考虑并非所有矿山和工厂都营业的情况,并允许一个矿山向多家工厂供货,而一家工厂也可以从多个矿山接受矿石。

假设XY为两个可分度量空间,使得X(或者Y ) 上的每个概率测度都是拉东测度,并假设c:X×Y[0,)是一个博雷尔可测函数。给定X上的概率测度μY上的概率测度ν,最优传输问题的蒙日形式是指寻找一个传输映射T:XY,使得下式中的下确界成立:

inf{Xc(x,T(x))dμ(x)|T*(μ)=ν},

其中T*(μ)T推进μ的向前推进算子。如果一个映射T达到这个下确界,则该映射被称为“最优传输映射”。

最优传输问题的蒙日形式有其局限性,因为有时可能不存在满足T*(μ)=ν的映射T。例如,当μ狄拉克测度ν不是时,就会出现这种情况。

此时可以通过采用最优传输问题的坎托罗维奇形式来克服这一局限,即寻找X×Y上的一个概率测度γ,使得下式中的下确界成立:

inf{X×Yc(x,y)dγ(x,y)|γΓ(μ,ν)},

其中Γ(μ,ν)表示X×Y上所有概率测度的集合并满足边缘分布μν。可以证明[9],当成本函数c是下半连续并且Γ(μ,ν)是紧测度集合(拉东空间XY蕴含该条件)时,该问题总是存在最小值(另见沃瑟斯坦度量)。Template:Le、史蒂文·哈克尔(Steven Haker)与Template:Le提出了蒙日–坎托罗维奇问题解的梯度下降表述。[10]

对偶形式

坎托罗维奇问题的最小值等于

sup(Xφ(x)dμ(x)+Yψ(y)dν(y)),

其中上确界遍历所有有界连续、满足

φ(x)+ψ(y)c(x,y)

的函数对。

经济学解释

将以上表述中的符号翻转更利于从经济学角度解释这一问题。假设xX表示工人特征的向量,yY表示企业特征的向量,Φ(x,y)=c(x,y)则表示工人x与企业y配对所创造的经济产出。令u(x)=φ(x)v(y)=ψ(y),蒙日–坎托罗维奇问题可以重新表述为:

sup{X×YΦ(x,y)dγ(x,y),γΓ(μ,ν)}

它的对偶形式为:

inf{Xu(x)dμ(x)+Yv(y)dν(y):u(x)+v(y)Φ(x,y)}

其中下确界遍历所有有界且连续的函数u:Xv:Y。如果对偶问题有解,则有:

v(y)=supx{Φ(x,y)u(x)}

可以将u(x)解释为x类型工人的均衡工资 ,并将v(y)解释为y类型企业的均衡利润。[11]

问题求解

一维连续情形

Template:Multiple image 对于1p<, 假设𝒫p()表示上所有p有限的概率测度的集合。设μ,ν𝒫p()c(x,y)=h(xy),其中h:[0,)是一个凸函数

  1. 如果μ没有Template:Le,即μ累积分布函数Fμ:[0,1]是一个连续函数,则Fν1Fμ:是一个最优传输映射。如果h是严格凸的,则它是唯一的最优映射。
  2. 可以得到
minγΓ(μ,ν)2c(x,y)dγ(x,y)=01c(Fμ1(s),Fν1(s))ds.

拉切夫(Rachev)与吕申多夫(Rüschendorf)于1998年给出了对此的证明。[12]

离散情形与线性规划

在边缘分布μν是离散的情形下,令μxνy分别是分配给x𝐗y𝐘的概率质量,而γxy则是xy的分配概率。原始坎托罗维奇问题中的目标函数为

x𝐗,y𝐘γxycxy

并满足约束条件

y𝐘γxy=μx,x𝐗
x𝐗γxy=νy,y𝐘.

为了将这一问题作为线性规划问题处理,我们需要将矩阵γxy向量化,可以通过堆叠其行或列来完成,我们用vec来表示这一操作。在Template:Le的情况下,上述约束条件可改写为

(11×|𝐘|I|𝐗|)vec(γ)=μ
(I|𝐘11×|𝐗|)vec(γ)=ν

其中克罗内克积1n×m是一个大小为n×m、所有元素为1的矩阵,而In是大小为n的单位矩阵。设z=vec(γ),该问题的线性规划形式为

Minimize vec(c)zsubject to:z0,(11×|𝐘|I|𝐗|I|𝐘|11×|𝐗|)z=(μν)

这一问题可以很容易地通过大规模线性规划求解器计算。[13]

半离散情形

在半离散情况下,令X=Y=d,且μd上的连续分布,ν=j=1Jνjδyi则是分配概率质量νjyjd的离散分布。此时,坎托罗维奇问题的原始形式为:[14]

inf{Xj=1Jc(x,yj)dγj(x),γΓ(μ,ν)}

其中γΓ(μ,ν)满足Xdγj(x)=νjjdγj(x)=dμ(x)

而其对偶形式则为

sup{Xφ(x)dμ(x)+j=1Jψjνj:ψj+φ(x)c(x,yj)}

还可以写为:

supψJ{Xinfj{c(x,yj)ψj}dμ(x)+j=1Jψjνj}

这是一个有限维凸优化问题,可以通过梯度下降等方法求解。

c(x,y)=|xy|2/2时,可以证明分配给特定jx𝐗集合是一个凸多面体,而得到的配置称为Template:Le[15]

二次正态情形

假设一个特殊情形μ=𝒩(0,ΣX)ν=𝒩(0,ΣY)c(x,y)=|yAx|2/2,其中A是可逆矩阵。此时有

φ(x)=xΣX1/2(ΣX1/2AΣYAΣX1/2)1/2ΣX1/2x/2
ψ(y)=yAΣX1/2(ΣX1/2AΣYAΣX1/2)1/2ΣX1/2Ay/2
T(x)=(A)1ΣX1/2(ΣX1/2AΣYAΣX1/2)1/2ΣX1/2x

加利雄(Galichon)于2016年证明了该情况下的解。[16]

可分希尔伯特空间

X是一个可分希尔伯特空间,定义𝒫p(X)X上所有p有限的概率测度的集合,𝒫pr(X)则表示其中高斯正则的测度集合,即如果gX上任何严格正的Template:Le且满足g(N)=0 ,则μ(N)=0也成立。

假设μ𝒫pr(X)ν𝒫p(X),并且c(x,y)=|xy|p/p,其中p(1,),p1+q1=1 。则坎托罗维奇问题存在一个唯一解κ ,并且该解对应一个最优传输映射:即存在一个博雷尔映射rLp(X,μ;X),使得

κ=(idX×r)*(μ)Γ(μ,ν).

此外,如果ν具有有界支撑,那么对于μ-几乎所有的xX,存在局部利普希茨c-凹和最大坎托罗维奇势φ,使得

r(x)=x|φ(x)|q2φ(x)

其中φ表示φ加托导数

熵正则化

考虑上述离散问题的一个变体:在原始问题的目标函数中添加一个熵正则化项

Minimize x𝐗,y𝐘γxycxy+εγxylnγxysubject to: γ0y𝐘γxy=μx,x𝐗x𝐗γxy=νy,y𝐘

相应的对偶问题为

maxφ,ψx𝐗φxμx+y𝐘ψyvyεx𝐗,y𝐘exp(φx+ψycxyε)

相较于不含正则化项的问题,原先对偶问题中的硬约束( φx+ψycxy0 )被替换为了软约束,即惩罚项εexp((φx+ψycxy)/ε)。对偶问题的最优条件可以表示为

式5.1: μx=y𝐘exp(φx+ψycxyε)x𝐗
式5.2: νy=x𝐗exp(φx+ψycxyε)y𝐘

A|𝐗|×|𝐘|的矩阵,其中元素Axy=exp(cxy/ε)。此时对偶问题的求解等价于寻找两个对角正矩阵D1D2,它们的大小分别为|𝐗||𝐘| ,使得D1AD21|𝐘|=μ(D1AD2)1|𝐗|=ν。矩阵D1D2的存在性是辛克宏定理的推广,可以使用辛克宏-诺普算法进行求解。[17]该算法通过迭代求解Template:EquationNote中的φxTemplate:EquationNote中的ψy实现。因此,辛克宏-诺普算法相当于对偶正则问题的坐标下降法

应用

蒙日-坎托罗维奇运输问题已广泛运用于许多领域,例如:

参见

参考文献

Template:Reflist

  1. G. Monge. Mémoire sur la théorie des déblais et des remblais. Histoire de l’Académie Royale des Sciences de Paris, avec les Mémoires de Mathématique et de Physique pour la même année, pages 666–704, 1781.
  2. Schrijver, Alexander, Combinatorial Optimization, Berlin; New York : Springer, 2003. Template:ISBN. Cf. p. 362 Template:Wayback
  3. Ivor Grattan-Guinness, Ivor, Companion encyclopedia of the history and philosophy of the mathematical sciences, Volume 1, JHU Press, 2003. Cf. p.831 Template:Wayback
  4. L. Kantorovich. On the translocation of masses. C.R. (Doklady) Acad. Sci. URSS (N.S.), 37:199–201, 1942.
  5. Template:Cite book
  6. Template:Cite book
  7. D. R. Fulkerson (1956) Hitchcock Transportation Problem Template:Wayback, RAND corporation.
  8. L. R. Ford Jr. & D. R. Fulkerson (1962) § 3.1 in Flows in Networks, page 95, Princeton University Press
  9. L. Ambrosio, N. Gigli & G. Savaré. Gradient Flows in Metric Spaces and in the Space of Probability Measures Template:Wayback. Lectures in Mathematics ETH Zürich, Birkhäuser Verlag, Basel. (2005)
  10. Template:Cite journal
  11. Galichon, Alfred. Optimal Transport Methods in Economics. Princeton University Press, 2016.
  12. Rachev, Svetlozar T., and Ludger Rüschendorf. Mass Transportation Problems: Volume I: Theory. Vol. 1. Springer, 1998.
  13. Galichon, Alfred. Optimal Transport Methods in Economics. Princeton University Press, 2016.
  14. Santambrogio, Filippo. Optimal Transport for Applied Mathematicians. Birkhäuser Basel, 2016. In particular chapter 6, section 4.2.
  15. Template:Citation.
  16. Galichon, Alfred. Optimal Transport Methods in Economics. Princeton University Press, 2016.
  17. Peyré, Gabriel and Marco Cuturi (2019), "Computational Optimal Transport: With Applications to Data Science", Foundations and Trends in Machine Learning: Vol. 11: No. 5-6, pp 355–607. DOI: 10.1561/2200000073.
  18. Template:Cite journal
  19. Template:Cite journal
  20. Template:Cite journal
  21. Template:Cite journal