符号说明
概率单纯形 $\Sigma_{n}$ ：
+
histogram（或概率向量）: $a \in \Sigma_{n}$ (列和为1的正向量)
离散测度：权重为 $a$ ，位置为 $x_1,..,x_n \in \mathcal{X}$ 的离散测度为

概率测度：离散测度的特殊情况，详见2.1中Remark 2.1.
在空间 $\mathcal{X}$ 的随机测度为 $\mathcal{M(X)}$ ，距离表示为 $d$ ，连续函数表示为 $f \in \mathcal{C(X)}$
测度的密度： $\mathcal{X}=R^{d}$ ，有密度 $d\alpha(x)= \rho_{\alpha}(x)dx$
$\mathcal{M_{+}(X)}$ 是在 $\mathcal{X}$ 上的所有正测度集合。
概率测度集合 $\mathcal{M_{+}^{1}(X)}$ ：对于任何 $\alpha \in \mathcal{M_{+}^{1}(X)}$ 为正，并且 $\alpha(\mathcal{X})=\int_{\mathcal{X}}d\alpha=1$
$Perm(n)$ ： $n$ 个元素排列的集合
Push-forward operator $T_\# \alpha=\beta$ （离散）& $T_{\#}: \mathcal{M(X) \to M(Y)}$ （连续）：将 $\alpha$ 的质量推到 $\beta$ 的质量上，详见Remark 2.5和Remark 2.4。
Transportation cost：

详见 Remark 2.4.
pull-back function $T^{\#}: \mathcal{C(Y) \to C(X)}$

详见Remark 2.8.

2. 理论基础

本章描述优化运输基础，介绍了第一个优化运输基础，引入在概率向量 $(a,b)$ 之间的优化匹配和耦合的概念，将运算一般化到离散测度 $(\alpha, \beta)$ ，最后包含任何测度。

2.1 Histograms and Measures

令histogram和概率向量表示 $a \in \Sigma_{n}$ 的任意元素。其中 $\sigma_n$ 是概率单纯形
Computational Optimal Transport笔记——第二章（1）
这个综述很大程度上关注在单纯形上的优化运输引起的几何研究。

Remark 2.1 （离散测度）权重为 $a$ ，位置为 $x_1,..,x_n \in \mathcal{X}$ 的离散测度为

其中 $\delta_{x_i}$ 是在位置 $x_i$ 的 Dirac，是一个质量单位（无限聚集在位置 $x$ 的质量）。
为了避免退化问题（没有质量的位置被考虑），当考虑离散测度时假设 $a$ 中所有元素都是正的。
如果 $a \in \sigma_{n}$ 或者更一般的 $a \geq 0$ ，这个测度描述的是概率测度。

Remark 2.2（一般的测度）在空间 $\mathcal{X}$ 的随机测度为 $\mathcal{M(X)}$ ， $\mathcal{X}$ 中的距离表示为 $d$ ，连续函数表示为 $f \in \mathcal{C(X)}$ 。（在连续函数上进行积分可以获得测度信息）
在离散测度 $\alpha$ 上 $f \in \mathcal{C(X)}$ 的积分为加和：

对于 $\mathcal{X}=R^{d}$ ，有密度 $d\alpha(x)= \rho_{\alpha}(x)dx$ ，对于Lebesgue测度，表示为 $\rho_{\alpha}=\frac{d \alpha}{dx}$ ，意味着

一个任意测度 $\alpha \in \mathcal{M(X)}$ （不需要有密度或者Diracs和）可以被定义通过它可以对连续函数 $f \in \mathcal{C(X)}$ 积分 $\int_{\mathcal{X}} f(x) d\alpha(x) \in R$ 。如果 $X$ 是紧的，可以强制 $f$ 有紧支撑集，在无穷处至少极限为0.
$\mathcal{M_{+}(X)}$ 是在 $\mathcal{X}$ 上的所有正测度集合。
概率测度集合 $\mathcal{M_{+}^{1}(X)}$ ：对于任何 $\alpha \in \mathcal{M_{+}^{1}(X)}$ 为正，并且 $\alpha(\mathcal{X})=\int_{\mathcal{X}}d\alpha=1$
图2.1展示了不同类型的测度。

2.2 Assignment and Monge Problem

给定 cost matirx $(C_{i,j})_{i \in [n], j \in [m]}$ ，假定 $n=m$ ，optimal assigment problem就是在集合 $Perm(n)$ 中寻找双射 $\sigma$ 使得
Computational Optimal Transport笔记——第二章（1）
optimal assigment problem——寻找使得cost达到最小的排列。好像图论中的最小权匹配与此问题相似
Remark 2.3（唯一性）optimal assignment problem可能有多个最优解。例如 $n=m=2$ ，如图 2.2的左图所示，两个 assignemt都是最优的。
Computational Optimal Transport笔记——第二章（1）

Remark 2.4（在离散测度下的Monge problem）对于离散测度

Monge problem就是找到一个映射，使得对对每个点 $x_i$ 关联到点 $y_j$ ，将 $\alpha$ 的质量推到 $\beta$ 的质量上，即 map $T: {x_1,..,x_n} \to {y_1,...,y_m}$ ，有

写成紧的形式为 $T_{\#}\alpha=\beta$ 。由于 $b$ 的所有元素都是正的，这个映射是满射。这个映射应该最小化 transportation cost。Transportation cost通过函数 $c(x,y)$ 参数化（定义在每个点 $(x,y) \in \mathcal{X \times Y}$ 上），

在离散点间的map可以被重写。假设所有的 $x$ 和 $y$ 都是不同的，使用索引

此时mass conservation可以被写为

特别地当 $n=m$ ，所有的权重都是均匀分布 $a_i=b_j=\frac{1}{n}$ ，mass conservation约束意味着 $T$ 是满射，Monge问题等价月optimal matching problem（2.2），其中 cost matrix为

Remark 2.5 (push-forward operator) 对于连续映射 $T: \mathcal{X \to Y}$ ，定义对应的 push-forward operator $T_{\#}: \mathcal{M(X) \to M(Y)}$ 。回顾对于离散的情况， $T_{\#}$ 的公式，push-forward operation 相当于移动测度支撑集中所有点的位置

对于有密度的测度，push-forward的定义在描述概率测度的空间更新（或者运输）方面有发挥了非常重要的作用。
定义 2.1 (push-forward) 对于 $T: \mathcal{X} \to \mathcal{Y}$ , 对于 $\alpha \in \mathcal{M(X)}$ push-forward measure $\beta = T_{\#} \alpha \in \mathcal{M(Y)}$ 满足

相等的，对于任意测度 $B \in \mathcal{Y}$ 有

可以注意到 $T_{\#}$ 保存了positive和全部的质量，有如果 $\alpha \in \mathcal{M_{+}^{1}(X)}$ ，则 $T_{\#} \alpha \in \mathcal{M_{+}^{1}(Y)}$
对 push-operator 的理解
测度映射 $T: \mathcal{X} \to \mathcal{Y}$ 可以被理解为将测度空间中一个点移动到另一个测度空间的函数。
$T_{\#}$ 是 $T$ 的扩展，将 $\mathcal{X}$ 上的概率测度移动到 $Y$ 上的概率测度。
$T_{\#}$ push forward $\mathcal{X}$ 上测度 $\alpha$ 中每个元素的质量到 $\mathcal{Y}$ 上每个元素的质量。
$T_{\#}$ 是线性的， $T_{\#}(\alpha_1+\alpha_2)=T_{\#}\alpha_1+T_{\#}\alpha_2$

Remark 2.6 (Push-forward for multivariate densities) 在 $R^{d}$ 中的测度有密度 $(\rho_{\alpha}, \rho_{\beta})$ ，假设T是光滑的、双射。有

Remark 2.7（在任意测度下的Monge problem ）

Remark 2.8 (push-forward vs. pull-back) pull-back function $T^{\#}: \mathcal{C(Y) \to C(X)}$ 。对于 $g \in \mathcal{C(Y)}$ ,

push-forward和pull-back是相伴随的

当测度 $(\alpha, \beta)$ 有密度的情况分析

Remark 2.9 （测度和随机变量）

Computational Optimal Transport笔记——第二章（1）

2. 理论基础

2.1 Histograms and Measures

2.2 Assignment and Monge Problem

相关推荐