Variable precision rough set based unsupervised band selection technique for hyperspectral image cla
基于可变精度粗糙集的无监督波段选择方法用于高光谱图像分类
摘要
该方法利用VPRS定义了一种新的依赖度量。此外,依赖度量的定义使其对VPRS中参数参数的误分类程度变得不那么敏感。该方法首先使用所提出的依赖测度计算每对波段之间的相似性,然后从相似度值最大的波段中选择一个波段。在此基础上,提出了一种利用一阶增量搜索逐条选择信息频带的新准则。
基本知识
粗糙集理论中用于计算上、下近似的包含算子具有很大的局限性。它在处理数据集中的边界模式方面不够。变精度粗糙集(VPRS)通过放宽上、下逼近公式来缓解这一问题。它根据统计趋势而非功能来评估数据模式。 VPRS的主要动机是允许以可控制的不确定度或错误分类错误进行分类。
粗糙集理论的基本概念是基于仅对离散数据可获得的等价类的生成。为了首先使用RST进行HSI波段选择,将连续波段值转换为离散波段值。对于离散化,可以使用等宽间隔折边,基于均值和标准差的离散化,粗糙化等。本文采用无监督等宽间隔封边技术进行离散化。在等宽间隔装箱离散化技术中,首先计算属性的最小值和最大值。然后,范围被划分为用户定义的数目的等宽离散区间。
离散化后,为了从a中选择一个信息频带子集,定义了度量任意两个频带之间冗余度的相似性度量。我们可以使用文献方法[38-40]在(4)中计算的RST的依赖度作为相似性度量。由于(4)中较低近似的计算限制性太强,且带的离散化以无监督的方式进行(即,在许多情况下,两个波段之间的依赖度为零。因此,依赖度不能度量波段之间的冗余度。定义了一种新的基于变精度粗糙集的相似性度量方法。由于VPRS在用于定义较低近似值的子集运算符上提供了松弛,因此降低了在一对频带之间产生零相关性的可能性。
关键点
1、相似性度量
为了从a中选择一个信息频带子集,定义了度量任意两个频带之间冗余度的相似性度量。在这方面,使用文献方法[38-40]在(4)中计算的RST的依赖度作为相似性度量。由于(4)中较低近似的计算限制性太强,且带的离散化以无监督的方式进行(即,在许多情况下,两个波段之间的依赖度为零。因此,依赖度无法度量。为了计算A中任意对带之间的相似度,本研究通过取平均依赖度来定义相似度度量。
2、改进以后的
相比于RST, VPRS提供了更好的依赖度量,但它依赖于参数β(误差因子)的选择。由于VPRS提供了对用来定义较低近似的子集算子的松弛,它减少了在带对之间产生零依赖的概率。
当β大时,可能存在多个分区X,其允许误差e。这意味着U中的对象xi可能属于SY,即使其等价类xb的元素分布在U / bk的多个分区中 这可能会导致X的较低的较低逼近度。为了减少此类问题的影响,并使相关性度量对β参数的依赖性降低,如果满足e <b,则在u中不包含对象xi U/bk中的两个以上等效类
3、一阶增量搜索
公式9形成一个对称矩阵(SM),其中包含A中每对频带之间的相似度值。在我们提出的工作中,基于生成的SM矩阵,从A中选择仅包含信息频带的子集Y.最初,Y =∅,S =A。我们的技术首先找到一个带对(bp,bq),p≠q在SM矩阵中具有最高相似值。然后选择bp或bq作为第一个信息带,即bp被选为信息带。
选择第一个频段bp后,Y和S将分别更新为Y = {bp}和S = {S-bp}。对于其余频段的选择,使用了一个简单的增量搜索(称为一阶增量搜索),它一次选择一个频段。在一阶增量搜索中,假设已经选择了(d − 1)个频段。基于准则从S中的其余频带中选择最佳的第d频带。
第一项计算bj与S中其余频带之间的最大相似度值。第二项计算bj与Y中所有已被选择为信息频带的所有频带之间的最大相似度值。 第一项的较高值表示除bj之外,S中还存在至少一个频带,该频带与频带bj非常相似。 第二项的较高值表示Y中存在一个与未选择的频带bj非常相似的频带。 对于未选择的频带bj,第一项的较高值和第二项的较低值表示如果将bj包含到Y中,它将是Y中的一个非冗余频带。因此,在此工作中,对于每个顺序搜索,S中都会产生最大rdnt()值的频带包括在Y中。更详细地讲,令(d -1)频带已经在Y中。使用一阶搜索,最佳第d频带bk∈S被选。
伪代码
主要贡献
个人认为本文的主要贡献就是选择的频带子集较少依赖于β值,VPRS提供了对用来定义较低近似的子集算子的松弛,它减少了在带对之间产生零依赖的概率。
读文献四问(以此督促自己)
1、本文解决了什么问题?
2、用了什么方法?即创新点在哪里?
3、还有什么不足的地方?
4、如果是你你会用什么方法去解决这个问题?