7/17 数字图像处理笔记

表示与描述

引言
表示方法

链码

多边形近似

使用最小周长多边形的多边形近似
MPP算法
其他多边形近似方法

标记图
边界线段
骨架
边界描绘子

一些简单的描绘子
形状数
傅里叶描绘子
统计矩

引言

表示一个区域涉及两种选择：(1)根据其外部特征(边界)来表示区域，或(2)根据其内部特征(如组成该区域的像素)表示区域。下一项任务是基于所选择的表示来描述区域。例如，区域可由其边界表示，边界可用特征对其进行描述，如长度、连接端点的直线的方向，以及边界上凹陷的数量。
当我们关注的点是形状特征时，可选择一种外部表示；而当关注的重点是内部属性如颜色和纹理时，可以选择一种内部表示。有时，需要同时使用这两种表示。无论哪种情形，选择用来作为描绘子的特征都应尽可能地对大小、平移和旋转不敏感。

表示方法

链码

链码是用曲线起始点的坐标和边界点方向代码来描述曲线或边界的方法，常被用来在图像处理、计算机图形学、模式识别等领域中表示曲线和区域边界。它是一种边界的编码表示法，用边界方向作为编码依据，为简化边界的描述，一般描述的是边界点集。它将线状地物或区域边界，由起点和一系列在基本方向上的单位矢量，给出每个后续点相对其前继点的方向编码表示。
7/17 数字图像处理笔记
如上图所示，在寻找链码时，制定一个起始点（黑点），沿着逆时针方向，寻找一圈直到闭合，链码为：300301121232，下一步的工作是将其归一化，这里归一化的具体指链码寻找具有旋转不变性和起始点选择随意性，，简单点的例子是001,010,100是起始点选择不同的一个链码的三种不同表现形式，这里统一将其归一化为代表的最小整数：001（四进制）。推广到上面的链码，归一化为：003011212323，集体左移一位。下一步求导数：前一位链码与后一位的差分（这里指逆时针转动90°的倍数（四链接））。

多边形近似

使用最小周长多边形的多边形近似

数字边界可以用多边形以任意精度来近似。对于一条闭合边界，当多边形的边数等于边界上的点数时，这种近似会变得很精确。此时，每个相邻的点定义了多边形的一条边。
目的：多边形近似的目的是使用数量尽可能少的线段来获取给定边界的基本形状。适度复杂的多边形近似技术还是很适合于图像处理任务。
基础知识：单元的大小决定着多边形的近似程度。在给定的应用中，我们的目的是使用合适的最大可能单元大小，以最少的顶点数来产生MPP。MPP的顶点要么与内墙中的凸顶点一致，要么与外墙中的凹定点的镜像顶点一致。

MPP算法

1.由简单连接的单元组合体是非自交的。
2.MPP的每个凸顶点都是一个W顶点，但并非边界的每个W顶点都是MPP的一个顶点。
3.MPP的每个镜像凹顶点都是一个B顶点，但并非边界的每个B顶点都是MPP的一个顶点。
4.所有的B顶点要么在MPP上，要么在MPP外；所有的W顶点，要么在MPP上，要么在MPP内。
5.单元组合体中包含的顶点序列的最左上角顶点，总是MPP的一个W顶点。
MPP算法的优势：是即使顶点数不多时，仍然可以保留原始边界的所有主要特征，另一个优点是可以进行边界平滑。

其他多边形近似方法

聚合技术：基于平均误差或其他准则的聚合技术已经运用到多边形近似技术问题。一种方法是沿一条边界来聚合一些点，直到拟合这些聚合点的直线的最小均方误差超过某个预设的阈值。当这种条件出现时，存储该直线的参数，将误差设为0，并且重复该过程，沿边界聚合新的点，直到该误差再次超过预设的阈值。这一过程结束后，相邻线段的交点就构成多边形的顶点。此种方法的主要难点是，得到的近似顶点并不总是对应于原始边界中的形变。
分裂技术：分裂边界线的一种方法是将线段不断地细分为两部分，直到满足规定的准则为止。例如，一个可能的要求是：一条边界线段到其两个端点的直线间的最大垂直距离不超过一个预设的阈值。如果准则满足，则与直线有着最大距离的点就成为一个顶点，这样就将初始线段切分成了两条子线段。这种方法在寻找变化显著的点时具有优势。对一条闭合边界，最好的起始点通常是边界上的两个最远点。

标记图

定义：标记图是边界的一维函数表示，它可以使用各种方法来生成。然而，不管如何生成标记图，基本概念都是将边界简化为描述起来可能比原始二维边界更简单的一维函数。
一种最简单的方法是以角度函数的形式画出质心到边界的距离。
7/17 数字图像处理笔记
图中的方法是平移不变的，但对旋转和缩放敏感。
为了实现旋转归一化，需要找到选取相同起始点的方法。类似链码里介绍的那样，选取距离长短轴最远的点即可。
为了实现缩放归一化，可以对每个值除以方差（简单的最大最小值归一化会因为噪声的影响而带来较大误差）。

边界线段

将一条边界分解为片段通常是很有用的，分解降低了边界的复杂度，从而简化了描述过程。而当边界包含一个或者多个写带形状信息的重要凹面时，这种方法尤其具有吸引力。
一个任意集合S的凸壳H是包含S的最小凸集。差集H-S称为集合S的凸缺D。区域边界可以按照如下方式来分割：追踪S的轮廓，并标记进入或离开一个凸缺的转变点。在原理上，这种方案与区域大小和方向无关。
7/17 数字图像处理笔记
实际上，由于数字化、噪声和分割变形的影响，数字边界往往是不规则的。这些影响通常会导致在边界上有着随机散布的无意义的小凸缺。与其试图通过后处理分出这些不规则边界，不如在对边界分割前用普通方法平滑边界。很多方法可以做到这一点。一种方法是追踪边界，并使用一个像素沿该边界的k个相邻像素的平均坐标代替这个像素的坐标。这种方法适用于较小的不规则边界，但它耗费时间且难以控制。较大的k值会导致过度平滑，较小的k值在某些边界线段可能会使平滑不够充分。一种更为稳定的技术是，在找到一个区域的凸缺前，先使用多边形近似。我们感兴趣的数字边界都是简单的多边形。

骨架

定义：表示平面区域内结构形状的一种重要方法是将它简化为图形。这种简化可以通过一种细化(也称为骨架化)算法得到该区域的骨架来实现。
一个区域的骨架可以用Blum提出的中轴变换(MAT)来定义。
7/17 数字图像处理笔记
区域MAT有一个直观的定义，该定义基于所谓的"草原之火概念"。将一个图像区域想象为由甘草组成的平坦大草原，且假设由草原边界点火。火线以相同的速度向区域中心推进。区域的MAT是同一时间多个火线到达点的集合。尽管一个区域的MAT会生成直觉上令人满意的骨架，但直接实现这一定义需要大量的计算。实现涉及计算每个内部点到一个区域边界上的每个点的距离。为了改善计算效率，人们提出了很多算法，即迭代删除一个区域的边界点的细化算法，删除这些点时要满足如下约束条件：
(1)不能删除端点；
(2)不能破坏连接性；
(3)不能导致区域的过度腐蚀。

边界描绘子

一些简单的描绘子

边界的长度：一条边界上像素的数量
边界的直径：边界上相距最远两点所构成线段（长轴）的距离；短轴垂直于长轴，与长轴的端点完全包围该边界，所形成的方框称为基本矩形，长轴与短轴之比称为边界的偏心率。
边界的曲率：有时用相邻边界线段的斜率差来作为这两条线段交点处的曲率描绘子。

形状数

定义：最小数量级的差分码，形状数与方向无关
阶数：即码的个数，对闭合边界，阶总是偶数
得到形状数方法：
首先确定阶数n
根据阶数、区域边界的基本矩形、离心率构造网格
获得链码（链码方向依据选取的网格）
在得到循环首差
首差中的最小循环数即为形状数

傅里叶描绘子

从边界中的任意点出发，以逆时针方向行进，将其坐标序列[x(k),y(k)],k=0,1,2,…,k-1作s(k)=x(k)+jy(k)将二维问题转换为一维问题，并对其作傅里叶变换：
7/17 数字图像处理笔记
u=0,1,2,…,k-1,复系数a（u）称为边界的傅里叶描绘子。而且仅使用前P个傅里叶系数可以近似描绘出边界。
性质：对平移、旋转和尺度变换不敏感。

统计矩

一条边界的形状也可以使用均值、方差和高阶矩等统计矩来定量描绘。
7/17 数字图像处理笔记
将g(r）个离散随机变量v，并形成一个直方图p(vi),i=为0,1,…,A-1,其n阶矩

M为vi平均值，零阶矩为1，一阶矩为0，二阶矩度量曲线在均值附近的扩展程度，三阶矩度量曲线在均值附近的对称性。