赵工的个人空间


专业技术部分转网页计算转业余爱好部分


 图像处理与人工智能

图像特征分析
  1. 颜色特征:
  2. 几何特征描述:
  3. 基本形状特征描述:
  4. 形状的链码与傅里叶描述子:
  5. 不变矩:
  6. 纹理特征分析:
  7. 其他特征或描述:

数字图像的分析和理解是图像处理的高级阶段,目的是使用计算机分析和识别图像,为此必须分析图像的特征。图像特征是指图像中可用作标志的属性,可以分为视觉特征和统计特征。

1. 颜色特征:

1)颜色直方图:

图像P中某一特征值为xi的像素个数为s(xi),总像素数为N,归一化处理后h(xi)=s(xi)/N。
图像P的特征直方图为:H(P)=[h(x1),h(x2),...,h(xn)]
事实上,直方图就是某一特征的概率分布,对于灰度图像,直方图就是灰度概率分布。
直方图特征还有累加直方图和二维直方图:
①累加特征直方图:
图像P某一特征直方图为:H(P)=[h(x1),h(x2),...,h(xn)]。如果:
图像特征分析
该特征的累加直方图为:K(P)=[k(x1),k(x2),...,k(xn)]
②二维直方图:
图像X的大小为MxN,由X采用3x3或5x5模板平滑得到的图像为Y,大小也为MxN,由X和Y组成二元组为图像X的广义图像。广义图像的直方图就是二维直方图。

2)直方图不变特征量:

直方图P(x)就可以看作是图像的概率密度函数,归一化后其积分为1。
x的k阶矩和k阶中心矩分别定义为:
图像特征分析            图像特征分析
令x的线性变换为:x'=ax+b
则x'的概率密度函数为:
图像特征分析
x'的一阶矩和k阶中心矩分别为:
图像特征分析         图像特征分析
可以使用中心矩构建几个不变量:
图像特征分析        图像特征分析        图像特征分析

3)颜色矩:

颜色矩是一种简单有效的颜色特征,以计算HIS空间的H分量为例。如果H(pi)为图像P的第i个像素的H值,则其前三阶颜色矩(中心矩)分别为:
图像特征分析            图像特征分析
图像特征分析
类似地,可以定义另外2个分量的颜色矩。

2. 几何特征描述:

1)质心:

由于目标在图像中总有一定的面积大小,定义目标面积中心就是该目标在图像中的位置,面积中心就是单位面积质量恒定的相同形状图形的质心。对大小为MxN的数字图像f(x,y):
图像几何特征
对二值图像,其质量分布是均匀的,故质心和形状中心重合。

2)周长:

区域的周长即区域的边界长度。一个形状简单的物体,用相对较短的周长来包围它所占有面积内的像素,周长就是包围所有像素的外边界的长度。由于周长的表示方法不同,计算方法也不同,常用的简便方法为:
·隙码表示:当把图像中的像素看作单位面积的小方块时,图像中的区域和背景均由小方块组成,区域周长即为区域和背景缝隙的长度和,交界线有且仅有水平和垂直两个方向
·链码表示:当把像素看作一个个点时,周长定义为区域边界像素的8链码的长度之和,当链码值为奇数时,其长度记作2的平方根;当链码值为偶数时,长度记作1
·面积表示:即周长用区域的边界点数之和表示

3)面积:

面积是物体总尺寸的一个方便度量,面积只与该物体的边界有关,而与其内部灰度级的变化无关。有几种方法计算面积:
①像素计数面积:
某图像的面积,就是统计其中边界内部的像素点的灰度级之和。对于二值图像,其面积就是统计为1的像素个数。一帧图像有k个区域,其总面积是各个区域面积之和。
②链码计算面积:
若给定封闭边界的某种表示,则相应连通区域的面积应为区域外边界包围的面积与内边界包围的面积(孔的面积)之差。用链码表示边界时,面积为边界内所包含的单元格数。
③边界坐标计算面积:
xy平面内的一个封闭曲线包围的面积由其轮廓积分给定。积分沿着该闭合曲线进行,将其离散化:
图像几何特征
式中,Nb为边界点的数目。

4)距离:

度量图像中两点P(i,j)和Q(h,k)之间的距离,常用3种方法:
①欧几里得距离:
图像几何特征
②4邻域距离:
图像几何特征
③8邻域距离:
图像几何特征

3. 基本形状特征描述:

1)长轴和短轴:

当物体的边界已知,用其外接矩形的尺寸来刻画它的基本形状是最简单的方法。求物体在坐标轴方向上的外接矩阵,只需计算物体边界点的最大和最小坐标值,就可得到物体的水平和垂直跨度。但是,对任意朝向的物体,有必要确定物体的主轴,然后计算反映物体形状特征的主轴方向上的长度和与之垂直方向上的宽度,这样的外接矩形是物体的最小外接矩形。
计算最小外接矩形的一种方法是,将物体的边界以每次3°左右增量在90°范围内旋转,每旋转一次记录一次其坐标系方向上的外接矩形边界点的最大和最小x和y值,旋转到某一个角度后,外接矩形的面积达到最小,取面积最小的外接矩形的参数为主轴意义下的长度和宽度。主轴可以通过矩的计算得到,也可以用求物体的最佳拟合直线的方法求出。

2)矩形度:

图像区域面积A,其最小外接矩形的面积为Amer,二者的比值为矩形度R=A/Amer。
矩形度反映区域对其最小外接矩形的充满程度。当区域为矩形时,矩形度为1;当区域为圆形时,R=π/4;对于边界弯曲呈不规则分布的区域,0<R<1。

3)长宽比:

长宽比r是将细长目标与近似矩形或圆形目标进行区分时采用的形状度量。长宽比r为最小外接矩形的宽与长的比值。

4)圆形度:

圆形度用来刻画物体边界的复杂程度,有4种圆形度测度。
①致密度:
致密度又称复杂度,也称分散度,其定义为区域周长P的平方与面积A的比:C=P*P/A。
致密度描述了区域单位面积的周长大小。致密度越大,表明单位面积的周长大,即区域离散,为复杂形状;反之,致密度小,为简单形状。当图像区域为圆时,C有最小值4π;其他任何形状的图像区域,C>4π,且形状越复杂,C值越大。正方形区域致密度为16,正三角形致密度为图像形状特征
②边界能量:
假定物体的周长为P,用变量表示边界上的点到某一起始点的距离。边界上任一点都有一个瞬时曲率半径r(p),它是该点与边界相切圆的半径。p点的曲率函数是:K(p)=1/r(p)。
定义单位边界长度的平均能量:
图像形状特征
在面积相同条件下,圆具有最小边界能量1/(R*R),其中R为圆的半径。边界能量更符合人感觉上对边界复杂性的理解。
③圆形性:
圆形性是一个用区域R的所有边界点定义的特征量:
图像形状特征
式中,分子为从区域重心到边界点的平均距离;分母为从区域重心到边界点的距离的方差。
图像形状特征  图像形状特征
当区域R趋向圆形时,特征量C是单调递增且趋向无穷的,它不受区域平移、旋转和尺度变化的影响,可以推广用于描述三维目标。
④面积与平均距离平方的比值:
图像形状特征
式中,xi为从具有N个点的物体中的第i个点到与其最近的边界点的距离。
相应的形状度量为:
图像形状特征

5)球状性:

球状性既可以描述二维目标,也可以描述三维目标:
图像形状特征
在二维情况下,ri代表区域内切圆的半径,而rc代表区域外切圆的半径,两个圆的圆形都在区域的重心上。当区域为圆时,球状性的值S达到最大值1;而当区域为其他形状时S<1。

4. 形状的链码与傅里叶描述子:

1)链码:

链码Chain Code在图像处理和模式识别中是常用的一种表示方法,根据链的斜率不同,常用4方向和8方向链码。在4方向链码中,4个方向码的长度都是一个像素单位;在8方向链码中,水平和垂直方向的方向码长度都是一个像素单位,而对角方向的4个方向码为2的平方根像素单位。它们的共同特点是直线段的长度固定,方向数有限,可以利用一系列具有这些特点的相连的直线段来表示目标的边界。只有边界的起点需要用绝对坐标表示,其余点都可只用接续方向来代表偏移量,由于表示一个方向数比表示一个坐标值所需比特数少,而且对每一个点只需要一个方向数就可以代替两个坐标值,因此链码可大大减少边界表示所需的数据量。一般以x轴正方向为0,即右方向,其他方向按逆时针排列。
从物体边界上任意选取某个点起始,跟踪边界并赋给每两个相邻像素的连线一个方向值,最后按照逆时针方向沿着边界将这些方向码码连接起来,就可以得到链码,因此链码的起始位置和链码完整地包含了目标的形状和位置信息。如001711222433445678656。
使用链码时,起点的选择很关键。对同一个边界,使用不同的起点得到的链码是不同的,因此可把链码归一化。给定一个从任意点开始的链码,把它看作一个由各方向数构成的自然数,将这些方向数依一个方向循环,以使它们所构成的自然数的值最小,然后将这样转换后所对应的链码起点作为这个边界的归一化链码的起点。
用链码表示给定目标的边界时,如果目标平移,链码不会发生变化;而如果目标旋转,则链码会发生变化。为此,可利用链码的一阶差分来重构一个表示原链码各段之间方向变化的新序列,相当于把链码进行旋转归一化。差分可用相邻两个方向数按反方向相减得到,后一个减去前一个。

2)傅里叶描述子:

对边界的离散傅里叶变化表达可以作为定量描述边界形状的基础,采用傅里叶描述的优点是将二维问题简化为一维问题。将xy平面与复平面uv重合,这样可用u+jv表示给定边界上的每个点(x,y),是点点对应的。
对xy平面上的K个点组成的边界,任意选择一个起点,然后沿着顺时针方向绕行一周,可以得到点序列,并使用复数形式表示,得到坐标序列:s(k)=x(k)+jy(k)
s(k)的离散傅里叶变换为:
图像形状特征
其中,傅里叶系数S(u)可称为边界的傅里叶描述子。傅里叶反变换为:
图像形状特征
由于傅里叶变换的高频分量对应一些细节,而低频分量对应基本形状,只利用S(u)的前M个系数来重构原来的图像,从而可以得到对s(k)的一个近似而不改变其基本形状。

5. 不变矩:

矩特征是利用力学中矩的概念,将区域内部像素作为质点,像素坐标作为力臂,从而以各阶矩的形式来表示区域的形状特征。

1)矩的定义:

对于大小为MxN的数字图像f(i,j)其(p+q)阶矩定义为:
图像不变矩
式中,f(i,j)相当于一个图像的质量,Mpq为不同p、q值下的图像的矩。当p、q取不同的值时,可以得到阶数不同的矩。
0阶矩:p=0,q=0
图像不变矩
一阶矩:P+q=1
图像不变矩
式中,M10为图像对j轴的惯性矩,M01为图像对i轴的矩。
二阶矩:p+q=2
图像不变矩
式中,M20为图像对j轴的惯性矩;M02为图像对i轴的惯性矩。

2)中心矩:

①质心:
零阶矩M00是区域密度的总和,可以理解为厚度为1的物体的质量,所以一阶矩M10和M01分别除以零阶矩M00所得到的坐标,就是物体质量的中心坐标,或者说是区域灰度重心的坐标,故称为质心:
图像不变矩
②中心矩:
中心矩mpq反映了区域中心中的灰度相对于灰度重心是如何分布的:
图像不变矩
m20和m02分别表示围绕通过灰度重心的垂直和水平轴线的惯性矩,如果m20>m02,则可能所计算的区域为一个水平方向拉长的区域;m30和m03的幅值可以度量所分析的区域等于垂直和水平轴线的不对称性,如果某区域为垂直和水平对称,则m30和m03之值为零。
为了得到矩的不变特征,定义归一化的中心矩:
图像不变矩      式中    r=(p+q)/2+1     p+q=2,3,4, ...

3)不变矩:

利用归一化的中心矩,可以得到利用upq表示的7个具有平移、比例和先转不变性的矩不变量:
图像不变矩
图像不变矩
图像不变矩
图像不变矩
图像不变矩
图像不变矩
图像不变矩
由于图像经采用量化后,会导致图像灰度层次和离散化图像的边缘表示的不精确,会对图像矩的提取产生影响,特别是对高阶矩特征的计算影响很大。高阶矩主要描述图像的细节,而低阶主要描述图像的整体特征,如面积、主轴等。不变矩及其组合具备了好的形状特征应具有的某些性质,已经用于印刷体字符的识别、飞机形状区分、景物匹配和染色体分析中。

6. 纹理特征分析:

纹理图像,在局部区域内可能呈现不规则性,但整体上则表现出某种规律性,其灰度分布往往表现出某种周期性。通过观察不同物体的图像,可以抽取出构成纹理特征的两个要素:
纹理基元:是一种或多种图像基元的组合,有一定的形状和大小。
纹理基元的排列组合:基元排列的疏密、周期性、方向性等的不同,能使图像的外观产生极大的改变。
纹理特征提取指的是通过一定的图像处理技术抽取出纹理特征,从而获得纹理的定量或定性描述的处理过程。因此,纹理特征提取包括检测出纹理基元和获得有关纹理基元排列分布方式的信息。
纹理分析方法大致分为统计方法和结构方法。统计方法适用于分析木纹、森林、山脉、草地等一类纹理细且不规则的物体,结构方法适用于布料的印刷图案或砖花样等一类纹理基元排列较规则的图像。

1)自相关函数:

设图像为f(m,n),自相关函数定义为:
纹理特征
上式可以计算出窗口(2ω+1)x(2ω+1)内每一个像素点(j,k)的自相关函数。
自相关函数0≤R≤1,如果自相关函数散布宽,说明像素间相关性强,此时对应纹理较粗;相反,则对应较细纹理。因此,利用自相关函数随ε、η大小而变化的规律,可以描述图像的纹理特征。

2)灰度差统计法:

设(x,y)为图像中的一点,该点与和它只有微小距离的点(x+Δx,y+Δy)的灰度差值为:
纹理特征
设灰度差分的所有可能值共有m级,令点(x,y)在整个图像上移动,累计出差分取各个数值的次数,由此就可以做出直方图,并得到取各个值的概率。
当采用较小i值的概率较大时,说明纹理较粗糙;概率比较平坦时,说明纹理较细。该方法采用以下参数描述纹理图像特征
·对比度:
纹理特征
角度方向二阶矩:
纹理特征
熵:
纹理特征
平均值:
纹理特征

3)行程长度统计法:
设点(x,y)的灰度值为g,与其相邻点的灰度值也可能为g,统计出从任一点出发沿θ方向上连续n各点都具有灰度值g发生的概率,记为p(g,n)。在某一个方向上具有相同灰度值的像素称为行程长度。由p(g,n)可以定义出能够较好描述纹理特征的参数:
长行程加重法:
纹理特征
灰度值分布:
纹理特征
行程长度分布:
纹理特征
行程比:
纹理特征
式中,N*N为像素总和。

4)灰度共生矩阵:

由于纹理是由灰度分布在空间位置上反复出现而形成的,因而在图像空间中相隔某距离的两像素间会存在一定的灰度关系,这种关系被称为图像中灰度的空间相关特性。通过研究灰度的空间相关性来描述纹理,是灰度共生矩阵的基础。
从灰度级为i的像素点出发,距离δ的另一个像素点同时发生的灰度级为j,定义这两个灰度在整个图像中发生的概率分布,称为灰度共生矩阵。灰度共生矩阵可以理解为像素对或灰度级对的直方图,反映了图像灰度关于方向、相邻间隔、变化幅度的综合信息。目前,一幅图像的灰度级数目一般是256,这样计算出来的灰度共生矩阵过大,为此常常在求灰度共生矩阵前将图像变换为16级的灰度图像。
为了便于分析,灰度共生矩阵元素常用概率值来表示,即将各元素除以各元素之和,得到归一化值,由此得到的共生矩阵为归一化矩阵。灰度共生矩阵中主对角线上的元素是一定位置关系下的两像素同灰度组合出现的次数,其大小有助于判别纹理的方向和粗细。
共生矩阵中元素值相对于主对角线的分布可用离散性来表示,常常反映纹理的粗细程度。离主对角线远的元素的归一化值高,即元素的离散性大,即一定位置关系的两像素间灰度差大的比例高。
从灰度矩阵抽取的纹理特征参数有几种:
①角二阶矩:
角二阶矩是灰度共生矩阵元素值平方的和,是图像灰度分布均匀性的量度,也称为能量。当灰度共生矩阵中的元素分布较集中于主对角线时,说明从局部区域观察图像的灰度分布是较均匀的。
纹理特征
从图像整体观察,纹理粗,此时角二阶矩值大;反过来则角二阶矩值较小。可以理解为,粗纹理含有较多能量,细纹理含有较少能量。
②对比度:
图像的对比度可以理解为图像的清晰度,即纹理清晰度。
纹理特征
式中,n=|i-j|。
在图像中,纹理的沟纹越深,则其对比度越大,图像的视觉效果越清晰。
③相关:
相关用来衡量灰度共生矩阵的元素在行的方向或列的方向的相似程序。
纹理特征
式中各参数为:
纹理特征          纹理特征
纹理特征      纹理特征
如果某图像具有水平方向的纹理,则图像在θ=0°的灰度共生矩阵的相关值往往大于45°、90°、135°的相关值。
④熵:
熵值是图像所具有的信息量的度量。
纹理特征
若图像没有任何纹理,则灰度共生矩阵几乎为零阵,则熵值接近0;若图像充满着细纹理,则熵值最大;若图像中分布着较少纹理,图像的熵值较小。

5)基于邻域特征统计的纹理分析方法:

就是把某一局部区域内灰度的统计特征作为图像纹理的测度,局部区域一般都选择正方形窗口。
①最大最小值法:
以像素(i,j)为中心的窗口(2k+1)X(2k+1)内的灰度最大值与最小值的差值来作为窗口中心的纹理统计值。该方法还可以按方向进行。
②方差法:
以像素(i,j)为中心的窗口(2k+1)X(2k+1)内的灰度方差作为窗口中心的纹理特征统计值:
纹理特征
式中,μ为灰度平均值。
③绝对值法:
以像素(i,j)为中心的窗口(2k+1)X(2k+1)内的每个像素灰度值与窗口内的灰度平均值的绝对差值的和作为窗口中心的纹理特征统计值:
纹理特征
④信息熵法:
以像素(i,j)为中心的窗口(2k+1)X(2k+1)内的每个像素的灰度值百分比熵之和作为窗口中心的纹理特征统计值:
纹理特征
式中,
纹理特征
⑤高斯滤波差值法:
选择如下高斯模板:
纹理特征
式中,(i0,j0)为模板中心坐标,σ为标准偏差,用于控制模板的作用宽度。
采用两个不同的标准偏差σ1与σ2对应的高斯模板,对原始图像进行滤波,把两个滤波输出的差值图像作为纹理统计值。标准偏差控制着被检测纹理尺度,σ1与σ2相差越大,检测出的纹理尺度就越大,该方法能检测出尺度较小的纹理。

6)频谱法:

频谱法借助于傅里叶频谱的频率特性来描述周期的或近乎周期的二维图像模式的方向性。傅里叶频谱中凸起的峰值对应纹理模式的主方向,这些峰值在频域平面的位置对应模式的基本周期,如果利用滤波把周期性成分除去,剩下的非周期部分可用于统计方法描述。
实际检测中,为简便起见,可把频谱转化到极坐标中,此时频谱可用函数S(r,θ)表示。对每个确定方向θ,S(r,θ)是一个一维函数Sθ(r);对每个确定的频率r,S(r,θ)是一个一维函数Sr(θ)。对给定的θ,分析Sθ(r)得到的频谱沿原点射出方向的行为特性;对给定的r,分析Sr(θ)得到的频谱在以原点为中心的圆上的行为特性。如果把这些函数对下标求和,可得到更为全局性的描述:
纹理特征          纹理特征
式中,R是以原点为中心的圆的半径。
S(r)和S(θ)构成整个图像或图像区域纹理频谱能量的描述。通过频谱曲线,可以看出纹理的朝向,并能计算最大值的位置。

7. 其他特征或描述:

1)标记:

标记是把二维的边界用一维的较易描述的函数形式来表述。产生标记最简单的方法是先求出给定物体的重心,然后把边界点与重心的距离作为角度的函数就得到一种标记。通过标记,就可以把二维形状描述问题转为一维波形分析问题。
上述方法产生的标记不受目标平移的影响,但尺度变换及旋转都有关。尺度变换会造成标记的幅度值发生变化,可以用最大值归一化到单位值的方法解决。解决旋转问题最常用的方法是选离重心最远的点作为标记点,另一种方法是求出边界主轴,以主轴上离重心最远的点作为标记点,后一种方法考虑了边界上的所有点,计算量较大,但也比较可靠。

2)拓扑描述符:

拓扑学研究图形不受畸变变形影响的性质。区域的拓扑性质对区域的全局描述很有用,这些性质既不依赖距离,也不依赖基于距离测量的其他特征。
如果把区域中的孔洞数H作为拓扑描述子,区域内的连接部分的个数C是区域的另一个拓扑特性。一个集合的连接部分就是它的最大子集,在这个子集的任何地方都可以用一条完全在子集中的曲线相连接。
欧拉数也是一个区域的拓扑描述子,欧拉数的定义为E=C-H。

3)角点:

角点是一幅图像的显著结构元素,表现为在多个方向上同时取得大的梯度。角点在大范围视角和光照稳定条件下相对稳定并能准确定位,常用于在一组关联图像中进行目标跟踪、确定图像之间的对应关系、为几何测量提供参考点以及摄像机系统标定等方面。一般通过计算图像在x或y方向上的一阶或二阶导数来寻找角点,最常用的为Harris角点检测器,也被称为Plessy特征点检测器。
图像I(u,v)在水平和垂直方向上一阶导数的计算是Harris角点检测器的基础:
Harris角点检测器
对于图像中的每个位置(u,v),首先计算三个值A(u,v)、B(u,v)、C(u,v):
Harris角点检测器
这些值组成局部矩阵M(u,v):
Harris角点检测器
然后A(u,v)、B(u,v)、C(u,v)分别与线性高斯滤波器HG,σ做卷积进行平滑:
Harris角点检测器
由于矩阵M*是对称的,可以对角化:
Harris角点检测器
其中,λ1和λ2是矩阵M*的特征值,定义为:
Harris角点检测器
这些特征值都是正实数,包含了图像结构的信息。
在均匀图像区域中,M*=0,因而λ12=0。另一方面,给定一个理想斜坡函数,则λ1>0而λ>=0,它们与边缘方向无关。这样,特征值代表了边缘强度,而它们相应的特征向量表示了边缘方向。
一个角点,在主方向上有很强的边缘,相当于两个特征值中的较大值;另有一个边缘与此边缘相垂直,相当于较小的特征值,二者对应的特征值必须是显著的。由于A*和B*≥0,可以假设trace(M*)>0,所以|λ1|>|λ2|,从而只有两个特征值中较小者|λ2|与角点的确定有关。
两个特征值的差为:
Harris角点检测器
其中,任何情况下存在:
Harris角点检测器
在角点上,此表达式的值应尽可能小,因此Harris角点检测器定义下面函数为角点强度:
Harris角点检测器
其中,参数α决定了检测器的敏感程度,实际中被赋值0.04~0.06之间的固定值,常用0.05,最大为0.25。α值越大,检测器越不敏感,检测到的角点数越少。Q(u,v)称为角点相应函数,并且返回在孤立角点的最大值。
若图像中的任意一点(u,v)满足:
Harris角点检测器
则该点作为角点的候选,其中阈值tH的大小由图像内容决定,一般在10000~1000000之间取值(常用25000)。阈值一旦确定,角点ci=<ui,vi,qi>就被插入到集合中;然后根据上式定义的角点强度qi=Q(ui,vi)进行降序排列。为了抑制错误角点在正确角点周围密集增长的趋势,指定区域内的最强角点外的所有点都被淘汰。为了实现这一功能,需要将角点表从头到尾遍历,删除与较强角点相邻的、排在表末端的较弱角点,邻域半径可选10像素。
为了对数字图像进行处理,可先通过一个小型的xy可分离滤波器Hp=Hpx*Hpy进行平滑,其中:
Harris角点检测器
使用下面的滤波核计算x和y方向的一阶偏导数,称为梯度滤波器:
Harris角点检测器
通过可分离高斯滤波器Hb=Hbx*Hby对结构矩阵M中的各个分量进行平滑,称为模糊滤波器:
Harris角点检测器

 

Copyright@dwenzhao.cn All Rights Reserved   备案号:粤ICP备15026949号
联系邮箱:dwenzhao@163.com  QQ:1608288659