引入
论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8242668&tag=1
已有工作:
-
非包映射: 使用一个实例或者所有实例的统计信息表示包,这将丢失大量信息。
-
传统包映射: 基于实例选取进行映射,但是不能使得包在新的映射空间有效区分。

论文作者提出判别包映射:选取更具代表性的实例,以此构建判别实例池,使得包可以在映射空间得以有效区分。

说明:所有图片源自原论文,无意侵权。
1 判别包映射
1.1 总体框架
本文符号表如下:
符号 |
含义 |
B |
训练集 |
n |
包数量 |
Bi |
包 |
yi∈Y={−1,+1} |
包标签 |
X |
实例空间 |
p |
实例空间大小 |
xi,j |
包中实例 |
P⊆X |
判别实例池 (Discriminative Instance Pool, DIP) |
m |
P大小 |
Biϕ=[s(Bi,x1ϕ),⋯,s(Bi,xmϕ)],wherexkϕ∈P |
包映射 |
s(Bi,xkϕ) |
包与实例xkϕ的相似度 |
算法大致步骤如下:
- 基于传统有监督分类算法于训练集获取DIP;
- 基于DIP将每一个包映射到新的特征空间并完成预测。
1.2 DIP优化
给定大小为n的数据集B,汇聚B中的所有实例构建大小为p的实例空间X。优化目标为:使用对角矩阵IP找到P⊆X,其中diag(IP)=d(P),并且:
d(P)i={1,xi∈P,0,otherwise.(1*)
令J(P)表示一个实例评价函数,则对P的评估如下:
P∗=argP⊆XmaxJ(P)s.t.∣P∣=m.(1)式1指出,所选择的时候应该在新的映射空间具有最大的判别力。
1.3 DIP评价函数
为了使得DIP具有最大的判别力,首先提出DIP优化的两大准则:
-
bag mapping must-link:标签相同的包在映射空间应该更相近。
-
bag mapping cannot-link:标签不同的包在映射空间能够体现出差异。
因此,DIP评价函数如下:
J(P)=21i,j∑KP(Bi,Bj)Qi,j,(2)其中
KP(Bi,Bj)=∥∥∥IPBiϕx−IPBjϕx∥∥∥2,(3)其中Biϕx与Biϕ类似,不同在于使用所有实例作为DIP;Q矩阵的元素定义如下:
Qi,j={−1/∣A∣,yiyj=1;1/∣B∣,yiyj=−1,(4)其中A={(i,j)∣yiyj=1}表示满足第一准则的成对约束集;B={(i,j)∣yiyj=−1}与此类似。根据式3、4,将式2重写为 (具体推导看原文):
J(P)=xkϕ∈P∑ϕkTLϕk,(5)其中ϕk=Bkϕx;L是一个源自Q的拉普拉斯矩阵,满足L=[Li,j]n×n=D−Q;D是一个对角矩阵,且Di,i=∑jQi,j。
令f(xkϕ,L)=ϕkTLϕk,则式1可以转变为:
P∗=P⊆Xmaxxkϕ∈P∑f(xkϕ,L)s.t.∣P∣=m.(6)为了找到最优的P∗,可以计算所有的f(xkϕ,L),再取得前m个作为DIP即可。
具体的DIP优化过程如下:
算法1: DIP优化算法
输入:
训练集B、实例空间X、DIP池大小m;
输出:
P={p1,⋯,pm};
1:P=∅,τ=0
2:使用所有包标签、式4获取矩阵Q
3:获取矩阵L
4:for xk∈X do
5: 计算分数f(xk,L)
6: if ∣P≤m or f(xk,L)>τ, then
7: P←P∪xk;
8: if ∣P>m, then
9: P←P/argminxk∈Pf(xk,L);
10: τ=minxk∈Pf(xk,L);
11:end for
12:return P;
如上,DIP优化的关键步骤为计算矩阵L以及每一个实例的得分f(xk,L),并找出得分最高的m个实例。当然,计算得分需要知道ϕk=Bkϕx=[s(Bk,x1ϕx),⋯,s(Bk,xmϕx)],具体的,需要知道如何计算s(Bk,x1ϕx)。
1.4 使用DIP映射包
映射的关键在于计算s(Bk,x1ϕx),文中的定义如下:
s(Bi,xkϕ)=xi,j∈Bimaxexp(−∥∥∥xi,j−xkϕ∥∥∥2/σ2)其中xi,j是包Bi中的第j个实例,σ是一个预设参数。映射结束之后,可以使用任意的分类算法进行学习。以下描述了两种判别包映射方法。
1.4.1 全局判别包映射 (Global Discriminative Bag Mapping)
所有的实例均计算分数,并选取m个高分实例。
-
aMILGDM:使用所有的训练实例。
-
pMILGDM:仅使用训练集种的正包。
1.4.2 局部判别包映射 (Local Discriminative Bag Mapping)
对每个包种的实例计算分数,并计算最高判别得分的一个实例加入DIP。
-
aMILLDM:从每个包选取一个最高得分实例。
-
pMILLDM:从每个正包选取一个最高得分实例。
2 实验
实验数据集如下:
