1、背景知识
1.1 信任函数
1.2、EK-NN
2、提出的BK_NN方法
2.1 构建BK_NN的bpa函数
假设识别框架Ω={ω0,ω1,...,ωh}包含着一个孤立点ω0,首先对对象xi利用KNN寻找K近邻。在构建BBA的过程中,引入了与对象与其KNN之间距离有关的接受和拒绝阈值,如图所示。

假设xi的最近邻xj的标签为ωs,xi和xj间的bpa函数基于每个类标签给出的接受阈值dtaωs以及拒绝阈值dtrωs:若xi和xj之间的距离dij比接受阈值dtaωs小,表明xi位于ωs对xj的接受区, xi将被认为最有可能属于ωs类;若dij比拒绝阈值dtrωs大,意味着xi超出了拒绝区,所以xi不太可能属于ωs类,它有更多的机会属于ωs的互补集ωs;若dij处于两者之间,则认为xi处于不确定区域(ωs⋃ωs)。基于以上概念,在此方法中,将bpa定义为与距离有关的函数:

其中dij是xi和其最近邻xj的距离,函数f1(.)和f2(.) 将有效的BBA的良好(预期)行为描述为类,满足一下性质:
1、f1(.)单调递减,且f1(.)∈[0,1];
2、若dij≤dtaωs,那么f1(dij,dtaωs)≥0.5;
3、f2(.)单调递增,且f1(.)∈[0,1];
4、若dij≥dtrωs,那么f2(dij,dtrωs)≥0.5。
以下两个sigmiod函数可以满足上述四个条件并构造bpa函数:

Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。

λ/4 是拐点处切线的斜率。dtaωs和dtrωs是sigmiod函数拐点的横坐标。 在确定这些调谐参数时,可以首先计算ωs中的每个训练数据与其kNN之间的平均距离。 在ωs中,训练数据的所有平均距离的平均值dωs可以用来确定dtaωs,dtrωs和λs。

从实践中建议γta∈[1,3],γtr∈[2γta,3γta]。较大的接受阈值将导致更多的对象提交到元类中,较小的拒绝阈值将使更多的对象被视为孤点。由此方法可建立K个bpa函数,使用DS证据理论融合便可得到有关xi是否属于ωs的证据。若xi不属于标签ωp,那么mωp(ωp)=1。
2.2融合bpa函数
融合k个bpa函数共分为两步:
(1)与同一类相关联的BBA的子组合;
(2)关于不同类的子组合结果的全局融合。
第一步可以用DS方法融合。第二步,全局融合。假如一个对象有11个近邻有6个邻居在ω1类中居,有5个邻居在ω2类中。 这种对象通常被认为很难分类,为了解决该问题,将该对象划分为ω1⋃ω2,表示不确定类。
假设k个近邻分别与h个类有关,[k1,k2,...,kh]表示每个类对应的bpa函数的个数,第一步首先找到kmax=max(k1,k2,...,kh)。若kmax−ki≤t,i=1,...,g,对象很可能在类的联合中(元类)。
Ψ(max)={ωi∣kmax−ki≤t}对于对象xi来说是很难分类的。 然而,每个类中的KNN数量不足以确定对象的类,并且对象可能在一个类中,在罕见的情况下,它不包括在CMAX中。 为了解决此问题,∣Ψ(max)∣所有基数小于或等于的元类都将被使用。

其中η∈[0.1,0.3]且t≥1。 较大的t可以产生较少的错误分类错误,但通常会导致较大的元类。应该根据我们想要的结果的不精确和错误分类之间的预期折衷来确定t。所以全局融合策略为:

公式17得到的是一个未规范化的结果。 在DP规则中,焦点元素A可以是Ω的任何子集,而在我们的规则中,焦点元素A只能是特定的类、未知的类或仅是选定的元类(但不是所有可能的元类 meta_class)。 然后,一旦所有BBA的合并,(17)得到的未归一化融合结果将被归一化。 不属于元类的冲突mass函数将被重新分配给其他焦点元素。 然而,再分配方法在融合结果上并不重要,因为要重新分配的冲突mass函数通常很小,并且大多数冲突的mass函数通常属于选定的元类。归一化公式为:

如果没有选择元类,则全局融合规则将只剩DS规则。 然而,如果保留所有元类,则全局融合规则表现为DP规则,所有部分冲突 信任函数是为这些元类保留的。 这个全局融合规则可以被认为是DS规则和DP规则之间的折衷,因为只有部分元类根据实际情况选择可用。
在BK-NN算法中,需要三个调谐参数γta,γtr和η。 通过使用训练数据进行交叉验证,可以得到参数γta和γtr。
3、实例
给定识别框架Ω={ω0,ω1,ω2,ω3},对象xi有五个K近邻,其中三个近邻属于ω1,两个属于ω2。则得到与相应的BK-NN BBA建模:

值得注意的是, 在计算焦点要素A的mass时ω1=ω0⋃ω2⋃ω3,ω2=ω0⋃ω1⋃ω3,ω3=ω0⋃ω2⋃ω1。我们可以看到,5个近邻中没有一个在ω3类中,这表明xi不可能属于ω3。 因此,一个特定的BBA应该作为额外的引入:

m1ω1(.)、m2ω1(.)、m3ω1(.)与ω1相关,m4ω1(.)和m5ω1(.)与ω1相关, (2)。分别使用Eq给出的DS规则将其融合,组合结果为:

可得kmax=k1=3,假设t=2,∣k1−k2∣=∣3−2∣<2,∣k1−k3∣=∣3−0∣=3,故Ψ(max)={ω1,ω2},选中的类元则为Ψ(max)={ω1⋃ω2,ω1⋃ω3,ω3⋃ω2}。则使用公式17全局的融合结果 m1ω1(.)、m2ω1(.)以及m3ω1(.)为:

因为没有冲突的信念要重新分配,组合结果已经标准化, 因此,我们不需要在这个特定的示例中使用(18)应用规范化步骤。 结果表明,xi对元类ω1⋃ω2有最大的信任函数,也就是说,最可能属于它。