一种比较不同植物形态相似度的计算机方法

著录项
  • CN201310504139.5
  • 20131023
  • CN103559705A
  • 20140205
  • 浙江工业大学
  • 丁维龙;吴水生;徐利锋;程志君;危扬;陈淑娇;刘洋;郑蕾
  • G06T7/00
  • G06T7/00

  • 浙江省杭州市下城区潮王路18号
  • 中国,CN,浙江(33)
  • 杭州天正专利事务所有限公司
  • 王兵;黄美娟
摘要
一种比较不同植物形态相似度的计算机方法,利用了植株拓扑结构特征、外围轮廓特征、器官几何结构信息。该方法首先采用简化的树图描述植物的拓扑结构,再基于树图编辑距离方法计算拓扑结构的相似度。然后,基于二维图形相似度算法计算包含植株的三维凸包在多个面上的投影间的相似度,在此基础上,整合所有投影的二维相似度值从而计算出植物外围轮廓的相似度。随后,综合考虑各级子树的几何属性,计算出植物几何细节的相似度。最后,融合上述植株多特征信息,计算出不同植物结构间的相似度。本发明能够量化不同植物间的形态相似性,达到通过相似度区分不同植物种类或科属的目的。
权利要求

1.一种比较不同植物形态相似度的计算机方法,其特征在于:所述 计算方法包括以下步骤:

1)从植物的拓扑结构、外围轮廓形状、植物内部细节特征三个方面 考虑,定义植物形态相似度的计算公式和计算流程

假设已计算出植物在n(n为正整数)个方面(如拓扑相似度、外 观轮廓相似度、多种内部细节特征相似度)的相似度值,记为特征向 量s=(s 0,s 1,…,s n-1) T,并赋给每种特征相应的权值因子(取值范围(0,1]), 记为行向量w=(w 0,w 1,…,w n-1),则加权平均相似度计算公式为:

S = w i s i Σ i = 1 n w i - - - ( 1 )

并用式子(2)求取最终相似度:

S = S + ( S m - S ) ( 1 - a n ) - - - ( 2 )

(1)、(2)两式中,s i∈[0,1],w i>0,a∈[0,1),i为1到n的整 数,a为经验常数,S m=max{s 0,s 1,…,s n-1}。

本发明考虑了植物七个方面的特征相似度,分别是:拓扑结构相 似度S t、外围廓形状相似度S 3g、主干上枝条的平均轴向角相似度S a、 一级侧枝与主干的直径比相似度S d、整体宽高比相似度S wh、二级侧 枝与一级侧枝间的轴向角均值相似度S a1、一级侧枝与主干的截面积 比相似度S s1。对这七个方面的特征相似度分别赋以权值:w t,w 3g,w a, w d,w wh,w a1,w s1,权值的取之值范围为(0,1)。记S m=max{S t,S 3g,S a, S d,S wh,S a1,S s1}, 为附带权值因子的七个特征相似度的加权平均 值。则根据式(2)可得植物形态相似度计算公式为:

S = S m - ( S m - S ) a 7 - - - ( 3 )

2)分别使用树图表示待比较的目标植物和源植物在计算机中的抽象

树图G定义为顶点V和边E的集合,记为G={V,E}。其中,顶 点仅表示节间(不包括叶子、花朵、果实等其它器官)。如果没有特别 说明,下文节点也表示树图顶点。节点的几何要素包括直径d、节间 长l、轴向角θ、旋转角φ。边则表示节点之间的连接方式,用有 序对(v 1,v 2)表示(其中v 1和v 2表示顶点)。节点间的连接方式有两种: 前驱关系(用‘<’表示)和分支关系(用‘+’表示)。对于关系v 1

3)基于树图编辑距离方法计算两棵植物拓扑结构间的相似度

3.1树图的轴向退化操作

植物拓扑结构的相似性比较,只考虑分支方式的差异性而不考虑 几何形状的差异性。为尽量扩大分支方式对拓扑相似性比较算法的影 响,对树图进行轴向退化操作。轴向退化操作定义为:对于树图T中 任一节点v,如果v有且仅有一个后继子节点,同时又存在父节点, 则将v从树图中剔除。通过这种方式得到的树图称为轴向退化树。轴 向退化操作可剔除树图上各子树树轴方向上多余的节点。

3.2树图编辑映射和映射约束

将源树图T s经过编辑序列S转化为目标树图T d所需的最小代价, 定义为这两棵树间的距离。编辑序列S是由若干插入、删除和替换操 作构成(如图4),它可由编辑映射直观地描述。编辑映射可用三元 组(M,T s,T d)来表示,其中M={(v i,w j)|1≤i≤|T s|,1≤j≤|T d|}。

为保证树图编辑距离操作遵循植物的自然生长规律,本发明对编 辑映射设置了三种约束,即树轴映射约束、子树节点数对齐映射约束 和子树深度对齐映射约束。假定节点v∈T d,w∈T s,(v,w)∈M,v和w 分别有子节点{v 0,v 1,v 2,…,v n}和{w 0,w 1,w 2,…,w m},并且满足关系 {v

树轴映射约束:若节点v 0在父节点v的轴生长方向上,即满足关 系v

子树节点数对齐映射约束:在进行子树映射时,该约束要求分别 对T[v 1],T[v 2],…,T[v n]和T[w 1],T[w 2],…,T[w m]按它们的节点数以 降序方式进行排序,然后在T[v i]和T[w i]之间按子树的节点数建立独 立子树映射。

子树深度对齐映射约束:在进行子树映射时,该约束要求分别对 T[v 1],T[v 2],…,T[v n]和T[w 1],T[w 2],…,T[w m]按它们的子树深度以 降序方式排序,然后在T[v i]和T[w i]之间按子树的深度建立独立子树 映射。

3.3拓扑相似度的计算

设置待比较的两个树图中的一个为目标树T d,另一个为源树T s。 分别求T d和T s的轴向退化树图,然后将T d的节点按照节点映射M进 行若干次插入、删除和替换操作后变换为T s所需的总代价D t(T d,T s) 定义为:

D t ( T d , T s ) = D t ( T [ p ( T d ) ] , T [ p ( T s ) ] ) + Σ i = 1 max { | b ( T d ) | , | b ( T s ) | } D t ( T [ b ( T d , i ) ] , T [ b ( T s , i ) ] ) - - - ( 4 ) 式中,p(T)表示树图T根节点的后继节点(非分支节点);b(T)表示 树图T根节点的分支节点集合,且b(T)的元素按其对应子树的节点 数。用b(T,i)表示该集合的第i个元素;当i>|b(T)|时,取 且 其中, 表示空树变成(删除节点)T 的代价, 表示T变成(插入节点)空树的代价,|T|表示树图T 的节点个数,i>|b(T)|表示访问集合b(T)时下标越界。

根据式(4),通过线性变换将实值距离映射到区间[0,1],从而得 到拓扑结构的相似度值(数值从0至1表示植物拓扑结构间的相似度 逐渐增大)。转换公式定义为:

S t ( T d , T s ) = 1 - D t ( T d , T s ) | T d | + | T s | - - - ( 5 )

至此,植物树图的拓扑相似度S t计算完成。

4)计算出两棵植物在外围轮廓上的相似度

4.1二维轮廓图形相似度计算

将待比较的图形的顶点坐标存放在特征向量 V=((x 0,y 0),(x 1,y 1),…,(x n,y n))中。考虑到图形的平移、旋转及伸缩不变性, 需对待比较的目标图形和源图形进行规范化操作。具体方法是:在直 角坐标系O-XY中,求出两轮廓顶点集的最小覆盖圆,再对这两个顶 点集进行平移操作,使得它们的最小覆盖圆的圆心位于原点处,然后 对顶点集进行缩放,使得各自的最小覆盖圆为单位圆(半径为1)。

对描述图形的顶点进行一致化操作。方法是:将上述最小单位外 接圆平均分成若干个面积相同的扇区(如图6)。如此,每隔弧度2π/K (K为整型常数)就可得到一条从圆心发出的射线。该射线与图形轮廓 的相交情况可能有:无交点、有一个或多个交点。如果无交点,则取 该射线反向延长线上离圆心最近的交点为标记交点。如果射线和轮廓 的交点只有一个时,将取该交点为标记交点;如果有多个交点时,则 取离圆心最远的交点记为标记交点。分别求出目标图形和源图形的K 个标记交点(x di,y di)、(x si,y si),并依次连接各自的标记交点,可分别获 得目标图形的近似轮廓G d和和源图形的近似轮廓G s。考虑到图形的 对称性,将G d按x轴翻转180°得到的图形记为G d’,然后采用欧式距 离法求两二维图形的相似度,如下式。

S g ( G d , G s ) = 1 - min { Σ i = 0 K - 1 [ ( x di - x si ) 2 + ( y di - y si ) 2 ] , Σ i = 0 K - 1 [ ( x di - x si ) 2 + ( y di - y si ) 2 ] } K - - - ( 6 )

式中,(x di,y di)表示G d的第i个顶点坐标,(x si,y si)表示G s的第i个顶点 坐标,(x di’,y di’)表示G d’的第i个顶点坐标。

4.2三维轮廓图形相似度计算

将包含整个植株的三维凸包在X、Y、Z三个面上进行投影,基 于二维图形相似度算法逐一计算目标植物和源植物在相同投影面上 的投影的相似度,然后整合所有投影的二维相似度值,从而计算出两 棵植物在外围轮廓上的相似度。具体步骤如下:

Step1分别提取图形G 3d和G 3s的特征向量 V=((x 0,y 0,z 0),(x 1,y 1,z 1),…,(x n-1,y n-1,z n-1))。

Step2对上述两个三维图形的顶点集进行平移操作,使得它们 最小覆盖球的球心和原点重合,然后对顶点集进行缩放,使得各自的 最小覆盖球变为单位球(半径为1)。

Step3将变换后的三维图形点集分别先绕x轴旋转2πi/K(K取 偶数)弧度,再绕y轴旋转2πj/K弧度,然后从z轴负方向分别对它 们投影,以获得目标图形的投影P dij和源图形的投影P sij。

Step4利用二维图形相似度计算方法计算相对应的P dij和P sij 的相似度,在所有投影的相似度值中取最大值作为目标图形G 3d和源 图形G 3s的相似度,其计算公式如下:

S 3 g ( G 3 d , G 3 s ) = max { S g ( P dij , P sij ) } , ( i , j = 0,1 , . . . , K 2 - 1 ) - - - ( 7 )

4.3计算植物外观轮廓相似度

使用能包含整棵树图点集的凸包及包含子树点集的凸包来描述 植物的轮廓特征。凸包的三维轮廓点集可通过遍历树图上的顶点的几 何信息计算得出。在树图整体点集凸包的相似度计算中,为提高运算 效率,对公式(7)进行降维处理:1)对于目标图形(树图T d)和源图形(树 图T s),只绕y轴旋转并从z轴负方向对其进行投影;2)假设根节点 所在空间位置为P,树图最小覆盖圆的圆心为O,则应约束PO连线 的方向与y轴重合。令T d的凸包图形绕y轴旋转2πi/K并从z轴负 方向对其投射得到的投影为P d0i,T s的凸包图形绕y轴旋转2πj/K并 从z轴负方向对其投射得到的投影为P s0j,则树图整体点集凸包的相 似度可用下式计算:

S 3 g ( T d , T s ) = max { S g ( P d 0 i , P s 0 j ) } , ( i , j = 0,1 , . . . , K 2 - 1 ) - - - ( 8 )

本发明还进一步考虑了树图的各级非退化完全子树之间的相似 性。对于某树图T的一个节点v,用T[v]表示以节点v为根的完全子 树(节点集合包括v及其所有子孙节点)。如果T[v]在数据结构上没有 退化成链表,且节点数大于2,且v至少有一个兄弟节点,则T[v]即 为一个非退化完全子树。如图7所示,该树图的0级非退化完全子树 为自身T[v 1]=T,1级非退化完全子树有T[v 2]、T[v 3]和T[v 4],2级非 退化完全子树有T[v 5]、T[v 6]和T[v 7]。

假设T d共有0~m级非退化完全子树,T s共有0~i级非退化完全 子树。对于某树图T,取其第i级非退化完全子树集合中与T最相似 的那个元素记为MS(T,i),则T d和T s最终的几何轮廓相似度值计算公 式为:

S 3 g ( T d , T s ) = Σ i = 0 min ( m , n ) S 3 g ( MS ( T d , i ) , MS ( T s , i ) ) min ( m , n ) , min ( m , n ) 0 0 , min ( m , n ) = 0 - - - ( 9 )

5)计算植物内部细节特征的相似度

本发明综合考虑各级子树的几何属性,如主干上枝条的平均轴向 角S a、一级侧枝与主干的直径比S d、整体宽高比S wh、二级侧枝与一 级侧枝的平均轴向角S a1、一级侧枝与主干的横截面积比S s1,从而计 算出植物几何细节的相似度。上述参数都是实值参数,本发明给出对 两正数参数x和y的相似度计算方法。不妨设x≥y,则参数x和y的 相似度计算方法定义为:

s ( x , y ) = 1 - | x 2 - y 2 | 2 xy , 1 x y < 2 + 1 0 , x y 2 + 1 - - - ( 10 )

例如两树T d和T s的轴向角均值分别为θ d和θ s,根据式(10)即可 得出轴向角相似度S a为:

S a(T d,T s)=s(θ d,θ s)   (11)

上式所得结果的范围是[0,1]。当相似度值为0时,表示这两个参 数因子完全不相似,为1时则表示他们完全相同。所以,相似度值越 大,表示待比较的两参数越相似。

采用类似的方法获得公式(3)中其它内部细节特征的相似度S d, S wh,S a1,S s1。

6)计算最终的植物形态相似度

融合上述植株多特征信息,如植物的拓扑结构、外围轮廓形状、 植物内部细节特征,利用所求出的各种细节的相似度值,结合公式 (5)、(9)和权值因子,根据步骤(1)定义的公式(3),最终计算出不同 植物结构间的整体相似度。

说明书
技术领域

本发明内容涉及到植物分类、模式识别领域,特别针对植物形态特征 的多样性发明了比较不同植物形态之间相似度的计算机方法。

植物的外部形态是自然分类方法进行植物分类的依据。不同植物种 类之间形态、结构及习性等方面的相似程度,能够描述它们在亲缘关系 上的亲疏程度。判别不同植物体之间的相似性,是进行植物分类检索的 一个关键步骤。传统的判别方法主要依靠人工操作,主观性较强、效率 较低且工作量大,故越来越不适应植物快速分类检索的需要。另外,精 确描述植物空间规律的植物结构模拟模型,在诸如农田蒸散的定量化、 作物株型设计、栽培措施优化的科学研究中具有实际指导意义。然而, 判断一个模型是不是精确,关键问题是判断重建的3D模型与真实植物之 间的相似程度。与三维模型的相似性计算与检索、DNA和蛋白质序列的 结构相似性比较、恶意代码相似性比较等相比,目前植物结构相似度计 算的研究还较薄弱。与树结构相似度计算方法主要包括:全局比较法、 分析比较法和基于树图的比较法。全局比较法比较植株的株高、树冠的 尺寸等参数来计算植物间的相似程度。这种方法能够粗略地比较植物体 的相似性,但不能精细地比较植物拓扑结构和器官的空间相似性。分析 比较法首先对植物的拓扑结构和器官的空间分布情况进行统计分析,在获 得这些实体的分布特征参数后,再利用这些特征来比较植物之间的相似 性。基于树图的比较法采用编辑距离描述待比较的两株植物。由于涉及 到较为复杂的数学运算和频繁的替换、删除、插入节点操作,这种方法 的比较过程有些复杂。另外,基于叶片的相似度能够在一定程度上区分 树种的种类,但这类研究针对的仅仅是植物的叶片,而未涉及到植物拓 扑结构和轮廓特征的相似度计算。树结构数据的相似度估计,其研究也仅 仅针对的是数据结构中的树结构,与真实的树木结构存在明显区别。综上 所述,目前国内外还缺少有效的用以比较不同植物结构间相似度的方法。

本发明提供了一种可进行植物形态相似度比较的计算机方法,以判别 不同植物体之间的相似性,从而为植物分类学和模式识别等领域提供一 种全新的技术手段。

本发明解决其技术问题所采用的技术方案是:

一种比较不同植物形态相似度的计算机方法,所述计算方法包括以 下步骤:

1)从植物的拓扑结构、外围轮廓形状、植物内部细节特征三个方面考虑, 定义植物形态相似度的计算公式和计算流程

假设已计算出植物在n(n为正整数)个方面(如拓扑相似度、外观轮廓 相似度、多种内部细节特征相似度)的相似度值,记为特征向量 s=(s0,s1,…,sn-1)T,并赋给每种特征相应的权值因子(取值范围(0,1]),记为 行向量w=(w0,w1,…,wn-1),则加权平均相似度计算公式为:

S = w i s i Σ i = 1 n w i - - - ( 1 )

并用式子(2)求取最终相似度:

S = S + ( S m - S ) ( 1 - a n ) - - - ( 2 )

(1)、(2)两式中,si∈[0,1],wi>0,a∈[0,1),i为1到n的整数, a为经验常数,Sm=max{s0,s1,…,sn-1}。

本发明考虑了植物七个方面的特征相似度,分别是:拓扑结构相似度
St、外围廓形状相似度S3g、主干上枝条的平均轴向角相似度Sa、一级侧
枝与主干的直径比相似度Sd、整体宽高比相似度Swh、二级侧枝与一级侧
枝间的轴向角均值相似度Sa1、一级侧枝与主干的截面积比相似度Ss1。对
这七个方面的特征相似度分别赋以权值:wt,w3g,wa,wd,wwh,wa1,ws1
权值的取之值范围为(0,1)。记Sm=max{St,S3g,Sa,Sd,Swh,Sa1,Ss1},
为附带权值因子的七个特征相似度的加权平均值。则根据式(2)可得植物
形态相似度计算公式为:

S = S m - ( S m - S ) a 7 - - - ( 3 )

2)分别使用树图表示待比较的目标植物和源植物在计算机中的抽象

树图G定义为顶点V和边E的集合,记为G={V,E}。其中,顶点 仅表示节间(不包括叶子、花朵、果实等其它器官)。如果没有特别说明, 下文节点也表示树图顶点。节点的几何要素包括直径d、节间长l、轴向 角θ、旋转角φ。边则表示节点之间的连接方式,用有序对(v1,v2)表示 (其中v1和v2表示顶点)。节点间的连接方式有两种:前驱关系(用‘<’ 表示)和分支关系(用‘+’表示)。对于关系v1

3)基于树图编辑距离方法计算两棵植物拓扑结构间的相似度

3.1树图的轴向退化操作

植物拓扑结构的相似性比较,只考虑分支方式的差异性而不考虑几 何形状的差异性。为尽量扩大分支方式对拓扑相似性比较算法的影响, 对树图进行轴向退化操作。轴向退化操作定义为:对于树图T中任一节 点v,如果v有且仅有一个后继子节点,同时又存在父节点,则将v从树 图中剔除。通过这种方式得到的树图称为轴向退化树。轴向退化操作可 剔除树图上各子树树轴方向上多余的节点。

3.2树图编辑映射和映射约束

将源树图Ts经过编辑序列S转化为目标树图Td所需的最小代价,定 义为这两棵树间的距离。编辑序列S是由若干插入、删除和替换操作构 成(如图4),它可由编辑映射直观地描述。编辑映射可用三元组(M,Ts, Td)来表示,其中M={(vi,wj)|1≤i≤|Ts|,1≤j≤|Td|}。

为保证树图编辑距离操作遵循植物的自然生长规律,本发明对编辑 映射设置了三种约束,即树轴映射约束、子树节点数对齐映射约束和子树 深度对齐映射约束。假定节点v∈Td,w∈Ts,(v,w)∈M,v和w分别有子 节点{v0,v1,v2,…,vn}和{w0,w1,w2,…,wm},并且满足关系 {v

树轴映射约束:若节点v0在父节点v的轴生长方向上,即满足关系v

子树节点数对齐映射约束:在进行子树映射时,该约束要求分别对 T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的节点数以降序方 式进行排序,然后在T[vi]和T[wi]之间按子树的节点数建立独立子树映 射。

子树深度对齐映射约束:在进行子树映射时,该约束要求分别对 T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的子树深度以降序 方式排序,然后在T[vi]和T[wi]之间按子树的深度建立独立子树映射。

3.3拓扑相似度的计算

设置待比较的两个树图中的一个为目标树Td,另一个为源树Ts。分 别求Td和Ts的轴向退化树图,然后将Td的节点按照节点映射M进行若干 次插入、删除和替换操作后变换为Ts所需的总代价Dt(Td,Ts)定义为:

D t ( T d , T s ) = D t ( T [ p ( T d ) ] , T [ p ( T s ) ] ) + Σ i = 1 max { | b ( T d ) | , | b ( T s ) | } D t ( T [ b ( T d , i ) ] , T [ b ( T s , i ) ] ) - - - ( 4 )

式中,p(T)表示树图T根节点的后继节点(非分支节点);b(T)表示树图
T根节点的分支节点集合,且b(T)的元素按其对应子树的节点数或深度
降序排列。用b(T,i)表示该集合的第i个元素;当i>|b(T)|时,取
且其中,表示空树变成(删除
节点)T的代价,表示T变成(插入节点)空树的代价,|T|表示树
图T的节点个数,i>|b(T)|表示访问集合b(T)时下标越界。

根据式(4),通过线性变换将实值距离映射到区间[0,1],从而得到 拓扑结构的相似度值(数值从0至1表示植物拓扑结构间的相似度逐渐增 大)。转换公式定义为:

S t ( T d , T s ) = 1 - D t ( T d , T s ) | T d | + | T s | - - - ( 5 )

至此,植物树图的拓扑相似度St计算完成。

4)计算出两棵植物在外围轮廓上的相似度

4.1二维轮廓图形相似度计算

将待比较的图形的顶点坐标存放在特征向量 V=((x0,y0),(x1,y1),…,(xn,yn))中。考虑到图形的平移、旋转及伸缩不变性, 需对待比较的目标图形和源图形进行规范化操作。具体方法是:在直角 坐标系O-XY中,求出两轮廓顶点集的最小覆盖圆,再对这两个顶点集 进行平移操作,使得它们的最小覆盖圆的圆心位于原点处,然后对顶点 集进行缩放,使得各自的最小覆盖圆为单位圆(半径为1)。

对描述图形的顶点进行一致化操作。方法是:将上述最小单位外接 圆平均分成若干个面积相同的扇区(如图6)。如此,每隔弧度2π/K(K为 整型常数)就可得到一条从圆心发出的射线。该射线与图形轮廓的相交情 况可能有:无交点、有一个或多个交点。如果无交点,则取该射线反向 延长线上离圆心最近的交点为标记交点。如果射线和轮廓的交点只有一 个时,将取该交点为标记交点;如果有多个交点时,则取离圆心最远的 交点记为标记交点。分别求出目标图形和源图形的K个标记交点(xdi,ydi)、 (xsi,ysi),并依次连接各自的标记交点,可分别获得目标图形的近似轮廓 Gd和和源图形的近似轮廓Gs。考虑到图形的对称性,将Gd按x轴翻转 180°得到的图形记为Gd’,然后采用欧式距离法求两二维图形的相似度, 如下式。

S g ( G d , G s ) = 1 - min { Σ i = 0 K - 1 [ ( x di - x si ) 2 + ( y di - y si ) 2 ] , Σ i = 0 K - 1 [ ( x di - x si ) 2 + ( y di - y si ) 2 ] } K - - - ( 6 )

式中,(xdi,ydi)表示Gd的第i个顶点坐标,(xsi,ysi)表示Gs的第i个顶点坐标, (xdi’,ydi’)表示Gd’的第i个顶点坐标。

4.2三维轮廓图形相似度计算

将包含整个植株的三维凸包在X、Y、Z三个面上进行投影,基于二 维图形相似度算法逐一计算目标植物和源植物在相同投影面上的投影的 相似度,然后整合所有投影的二维相似度值,从而计算出两棵植物在外 围轮廓上的相似度。具体步骤如下:

Step1分别提取图形G3d和G3s的特征向量 V=((x0,y0,z0),(x1,y1,z1),…,(xn-1,yn-1,zn-1))。

Step2对上述两个三维图形的顶点集进行平移操作,使得它们最小 覆盖球的球心和原点重合,然后对顶点集进行缩放,使得各自的最小覆 盖球变为单位球(半径为1)。

Step3将变换后的三维图形点集分别先绕x轴旋转2πi/K(K取偶 数)弧度,再绕y轴旋转2πj/K弧度,然后从z轴负方向分别对它们投影, 以获得目标图形的投影Pdij和源图形的投影Psij。

Step4利用二维图形相似度计算方法计算相对应的Pdij和Psij的相 似度,在所有投影的相似度值中取最大值作为目标图形G3d和源图形G3s 的相似度,其计算公式如下:

S 3 g ( G 3 d , G 3 s ) = max { S g ( P dij , P sij ) } , ( i , j = 0,1 , . . . , K 2 - 1 ) - - - ( 7 )

4.3计算植物外观轮廓相似度

使用能包含整棵树图点集的凸包及包含子树点集的凸包来描述植物 的轮廓特征。凸包的三维轮廓点集可通过遍历树图上的顶点的几何信息 计算得出。在树图整体点集凸包的相似度计算中,为提高运算效率,对 公式(7)进行降维处理:1)对于目标图形(树图Td)和源图形(树图Ts),只 绕y轴旋转并从z轴负方向对其进行投影;2)假设根节点所在空间位置 为P,树图最小覆盖圆的圆心为O,则应约束PO连线的方向与y轴重合。 令Td的凸包图形绕y轴旋转2πi/K并从z轴负方向对其投射得到的投影 为Pd0i,Ts的凸包图形绕y轴旋转2πj/K并从z轴负方向对其投射得到的 投影为Ps0j,则树图整体点集凸包的相似度可用下式计算:

S 3 g ( T d , T s ) = max { S g ( P d 0 i , P s 0 j ) } , ( i , j = 0,1 , . . . , K 2 - 1 ) - - - ( 8 )

本发明还进一步考虑了树图的各级非退化完全子树之间的相似性。 对于某树图T的一个节点v,用T[v]表示以节点v为根的完全子树(节点 集合包括v及其所有子孙节点)。如果T[v]在数据结构上没有退化成链表, 且节点数大于2,且v至少有一个兄弟节点,则T[v]即为一个非退化完全 子树。如图7所示,该树图的0级非退化完全子树为自身T[v1]=T,1级 非退化完全子树有T[v2]、T[v3]和T[v4],2级非退化完全子树有T[v5]、T[v6] 和T[v7]。

假设Td共有0~m级非退化完全子树,Ts共有0~i级非退化完全子树。 对于某树图T,取其第i级非退化完全子树集合中与T最相似的那个元素 记为MS(T,i),则Td和Ts最终的几何轮廓相似度值计算公式为:

S 3 g ( T d , T s ) = Σ i = 0 min ( m , n ) S 3 g ( MS ( T d , i ) , MS ( T s , i ) ) min ( m , n ) , min ( m , n ) 0 0 , min ( m , n ) = 0 - - - ( 9 )

5)计算植物内部细节特征的相似度

本发明综合考虑各级子树的几何属性,如主干上枝条的平均轴向角 Sa、一级侧枝与主干的直径比Sd、整体宽高比Swh、二级侧枝与一级侧枝 的平均轴向角Sa1、一级侧枝与主干的横截面积比Ss1,从而计算出植物几 何细节的相似度。上述参数都是实值参数,本发明给出对两个正数x和y 的相似度计算方法。不妨设x≥y,则参数x和y的相似度计算方法定义 为:

s ( x , y ) = 1 - | x 2 - y 2 | 2 xy , 1 x y < 2 + 1 0 , x y 2 + 1 - - - ( 10 )

例如两树Td和Ts的轴向角均值分别为θd和θs,根据式(10)即可得出 轴向角相似度Sa为:

Sa(Td,Ts)=s(θd,θs)   (11)

上式所得结果的范围是[0,1]。当相似度值为0时,表示这两个参数 因子完全不相似,为1时则表示他们完全相同。所以,相似度值越大,表 示待比较的两参数越相似。

采用类似的方法获得公式(3)中其它内部细节特征的相似度Sd,Swh, Sa1,Ss1。

6)计算最终的植物形态相似度

融合上述植株多特征信息,如植物的拓扑结构、外围轮廓形状、植 物内部细节特征,利用所求出的各种细节的相似度值,结合公式(5)、(9) 和权值因子,根据步骤(1)定义的公式(3),最终计算出不同植物结构间 的整体相似度。

本发明的技术构思

随着计算机软、硬件性能的提高,以及模式识别、图像处理技术的 发展,传统的植物分类和检索方法已不能满足人们的要求,需要探索简 便、快捷、有效的全新的技术方法。利用这种方法,不仅可以判别不同 植物种类之间形态、结构及习性等方面的相似程度,也可以判断重建的 3D模型与真实植物之间的相似程度,从而为植物分类检索提供有效的技 术支撑。

因此,本发明依据植株拓扑结构特征、外围轮廓特征及器官几何结构 信息,发明了一种计算不同植物间形态相似度的方法。该方法采用简化 树图描述植物的拓扑结构,再基于树图编辑距离方法计算拓扑结构的相 似度。基于二维图形相似度算法计算包含植株的三维凸包在多个面上的 投影间的相似度,并整合所有投影的二维相似度值以计算出植物外围轮 廓的相似度。综合考虑各级子树的几何属性,计算出植物几何细节的相 似度。在此基础上,根据植物形态相似度的定义,计算出不同植物结构 间的相似度。

本发明的有益效果主要表现在:应用本发明发明的比较不同植物形 态相似度的计算机方法,可以有效地比较不同植物间的形态相似性,达 到通过相似度区分不同植物种类或科属的目的,从而为植物分类学和模 式识别等领域提供一种全新的模式分类手段。

图1是植物形态相似度计算方法的总体流程。

图2是一个树图的例子。

图3为一个树图进行轴向退化操作的示例。

图4描述了一个树图如何编辑成为另一个树图。

图5显示了三种编辑映射约束。

图6为如何用轮廓点集近似地表示二维图形。

图7为一个非退化完全子树的示例。

下面结合附图对本发明作进一步描述。

参照图1,一种比较不同植物形态相似度的计算机方法,包括以下步 骤:

1)从植物的拓扑结构、外围轮廓形状、植物内部细节特征三个方面考虑, 定义植物形态相似度的计算公式和计算流程

假设已计算出植物在n(n为正整数)个方面(如拓扑相似度、外观轮廓 相似度、多种内部细节特征相似度)的相似度值,记为特征向量 s=(s0,s1,…,sn-1)T,并赋给每种特征相应的权值因子(取值范围(0,1]),记为 行向量w=(w0,w1,…,wn-1),则加权平均相似度计算公式为:

S = w i s i Σ i = 1 n w i - - - ( 1 )

并用式子(2)求取最终相似度:

S = S + ( S m - S ) ( 1 - a n ) - - - ( 2 )

(1)、(2)两式中,si∈[0,1],wi>0,a∈[0,1),i为1到n的整数, a为经验常数,Sm=max{s0,s1,…,sn-1}。

本发明考虑了植物七个方面的特征相似度,分别是:拓扑结构相似度
St、外围廓形状相似度S3g、主干上枝条的平均轴向角相似度Sa、一级侧
枝与主干的直径比相似度Sd、整体宽高比相似度Swh、二级侧枝与一级侧
枝间的轴向角均值相似度Sa1、一级侧枝与主干的截面积比相似度Ss1。对
这七个方面的特征相似度分别赋以权值:wt,w3g,wa,wd,wwh,wa1,ws1
权值的取之值范围为(0,1)。记Sm=max{St,S3g,Sa,Sd,Swh,Sa1,Ss1},
为附带权值因子的七个特征相似度的加权平均值。则根据式(2)可得植物
形态相似度计算公式为:

S = S m - ( S m - S ) a 7 - - - ( 3 )

植物形态相似度的比较流程如图1所示。首先,分别使用树图表示 待比较的目标植物和源植物在计算机中的抽象。针对它们各自的树图, 分别使用拓扑相似度算法和几何形状相似度算法进行计算处理,并添加 权值因子,最终计算出两株植物形态相似度。

2)分别使用树图表示待比较的目标植物和源植物在计算机中的抽象

树图G定义为顶点V和边E的集合,记为G={V,E}。其中,顶点仅 表示节间(不包括叶子、花朵、果实等其它器官)。如果没有特别说明, 下文节点也表示树图顶点。节点的几何要素包括直径d、节间长l、轴向 角θ、旋转角φ。边则表示节点之间的连接方式,用有序对(v1,v2)表示 (其中v1和v2表示顶点)。节点间的连接方式有两种:前驱关系(用‘<’ 表示)和分支关系(用‘+’表示)。对于关系v1

3)基于树图编辑距离方法计算两棵植物拓扑结构间的相似度

3.1树图的轴向退化操作

植物拓扑结构的相似性比较,只考虑分支方式的差异性而不考虑几 何形状的差异性。为尽量扩大分支方式对拓扑相似性比较算法的影响, 对树图进行轴向退化操作。轴向退化操作定义为:对于树图T中任一节 点v,如果v有且仅有一个后继子节点,同时又存在父节点,则将v从树 图中剔除。通过这种方式得到的树图称为轴向退化树。轴向退化操作可 剔除树图上各子树树轴方向上多余的节点。例如,图3中树图T的节点 v1,v2,v3,v4,v5满足上述条件,因此可将它们一一剔除,从而得到轴向退化 树T’。

3.2树图编辑映射和映射约束

将源树图Ts经过编辑序列S转化为目标树图Td所需的最小代价,定义 为这两棵树间的距离。编辑序列S是由若干插入、删除和替换操作构成 (如图4),它可由编辑映射直观地描述。编辑映射可用三元组(M,Ts,Td) 来表示,其中M={(vi,wj)|1≤i≤|Ts|,1≤j≤|Td|}。

为保证树图编辑距离操作遵循植物的自然生长规律,本发明对编辑 映射设置了三种约束,即树轴映射约束、子树节点数对齐映射约束和子树 深度对齐映射约束。假定节点v∈Td,w∈Ts,(v,w)∈M,v和w分别有子 节点{v0,v1,v2,…,vn}和{w0,w1,w2,…,wm},并且满足关系 {v

树轴映射约束:若节点v0在父节点v的轴生长方向上,即满足关系v

子树节点数对齐映射约束:在进行子树映射时,该约束要求分别对 T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的节点数以降序方 式进行排序,再在T[vi]和T[wi]之间按子树的节点数建立独立子树映射。

子树深度对齐映射约束:在进行子树映射时,该约束要求分别对 T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的子树深度以降序 方式排序,然后在T[vi]和T[wi]之间按子树的深度建立独立子树映射。

图5中,如果v的轴向子树A和w的轴向子树A’之间建立独立子树 映射,则A和A’满足树轴映射约束。如果C和B’之间建立独立子树映 射,B和C’之间建立独立子树映射,则它们之间分别满足了子树节点数 对齐映射约束。如果B和B’间建立独立子树映射,C和C’间建立独立 子树映射,则它们之间分别满足子树深度对齐映射约束。

3.3拓扑相似度的计算

设置待比较的两个树图中的一个为目标树Td,另一个为源树Ts。分 别求Td和Ts的轴向退化树图,然后将Td的节点按照节点映射M进行若干 次插入、删除和替换操作后变换为Ts所需的总代价Dt(Td,Ts)定义为:

D t ( T d , T s ) = D t ( T [ p ( T d ) ] , T [ p ( T s ) ] ) + Σ i = 1 max { | b ( T d ) | , | b ( T s ) | } D t ( T [ b ( T d , i ) ] , T [ b ( T s , i ) ] ) - - - ( 4 )

式中,p(T)表示树图T根节点的后继节点(非分支节点);b(T)表示树图
T根节点的分支节点集合,且b(T)的元素按其对应子树的节点数或深度
降序排列。用b(T,i)表示该集合的第i个元素;当i>|b(T)|时,取
且其中,表示空树变成(删除
节点)T的代价,表示T变成(插入节点)空树的代价,|T|表示树
图T的节点个数,i>|b(T)|表示访问集合b(T)时下标越界。

根据式(4),通过线性变换将实值距离映射到区间[0,1],从而得到 拓扑结构的相似度值(数值从0至1表示植物拓扑结构间的相似度逐渐增 大)。转换公式定义为:

S t ( T d , T s ) = 1 - D t ( T d , T s ) | T d | + | T s | - - - ( 5 )

至此,植物树图的拓扑相似度St计算完成。

4)计算出两棵植物在外围轮廓上的相似度

4.1二维轮廓图形相似度计算

将待比较的图形的顶点坐标存放在特征向量 V=((x0,y0),(x1,y1),…,(xn,yn))中。考虑到图形的平移、旋转及伸缩不变性, 需对待比较的目标图形和源图形进行规范化操作。具体方法是:在直角 坐标系O-XY中,求出两轮廓顶点集的最小覆盖圆,再对这两个顶点集进 行平移操作,使得它们的最小覆盖圆的圆心位于原点处,然后对顶点集 进行缩放,使得各自的最小覆盖圆为单位圆(半径为1)。

对描述图形的顶点进行一致化操作(使顶点个数相同)。一致化方法 是:将上述最小单位外接圆平均分成若干个面积相同的扇区(如图6)。如 此,每隔弧度2π/K(K为整型常数)就可得到一条从圆心发出的射线。该 射线与图形轮廓的相交情况可能有:无交点、有一个或多个交点。如果 无交点,则取该射线反向延长线上离圆心最近的交点为标记交点。如果 射线和轮廓的交点只有一个时,将取该交点为标记交点;如果有多个交 点时,则取离圆心最远的交点记为标记交点。分别求出目标图形和源图 形的K个标记交点(xdi,ydi)、(xsi,ysi),并依次连接各自的标记交点,可分别 获得目标图形的近似轮廓Gd和和源图形的近似轮廓Gs。考虑到图形的对 称性,将Gd按x轴翻转180°得到的图形记为Gd’,然后采用欧式距离法 求两二维图形的相似度,如下式。

S g ( G d , G s ) = 1 - min { Σ i = 0 K - 1 [ ( x di - x si ) 2 + ( y di - y si ) 2 ] , Σ i = 0 K - 1 [ ( x di - x si ) 2 + ( y di - y si ) 2 ] } K - - - ( 6 )

式中,(xdi,ydi)表示Gd的第i个顶点坐标,(xsi,ysi)表示Gs的第i个顶点坐标, (xdi’,ydi’)表示Gd’的第i个顶点坐标。

4.2三维轮廓图形相似度计算

将包含整个植株的三维凸包在X、Y、Z三个面上进行投影,基于二 维图形相似度算法逐一计算目标植物和源植物在相同投影面上的投影的 相似度,然后整合所有投影的二维相似度值,从而计算出两棵植物在外 围轮廓上的相似度。具体步骤如下:

Step1分别提取图形G3d和G3s的特征向量 V=((x0,y0,z0),(x1,y1,z1),…,(xn-1,yn-1,zn-1))。

Step2对上述两个三维图形的顶点集进行平移操作,使得它们最小 覆盖球的球心和原点重合,然后对顶点集进行缩放,使得各自的最小覆 盖球变为单位球(半径为1)。

Step3将变换后的三维图形点集分别先绕x轴旋转2πi/K(K取偶 数)弧度,再绕y轴旋转2πj/K弧度,然后从z轴负方向分别对它们投影, 以获得目标图形的投影Pdij和源图形的投影Psij。

Step4利用二维图形相似度计算方法计算相对应的Pdij和Psij的相 似度,在所有投影的相似度值中取最大值作为目标图形G3d和源图形G3s 的相似度,其计算公式如下:

S 3 g ( G 3 d , G 3 s ) = max { S g ( P dij , P sij ) } , ( i , j = 0,1 , . . . , K 2 - 1 ) - - - ( 7 )

4.3计算植物外观轮廓相似度

使用能包含整棵树图点集的凸包及包含子树点集的凸包来描述植物 的轮廓特征。凸包的三维轮廓点集可通过遍历树图上的顶点的几何信息 计算得出。在树图整体点集凸包的相似度计算中,为提高运算效率,对 公式(7)进行降维处理:1)对于目标图形(树图Td)和源图形(树图Ts),只 绕y轴旋转并从z轴负方向对其进行投影;2)假设根节点所在空间位置 为P,树图最小覆盖圆的圆心为O,则应约束PO连线的方向与y轴重合。 令Td的凸包图形绕y轴旋转2πi/K并从z轴负方向对其投射得到的投影 为Pd0i,Ts的凸包图形绕y轴旋转2πj/K并从z轴负方向对其投射得到的 投影为Ps0j,则树图整体点集凸包的相似度可用下式计算:

S 3 g ( T d , T s ) = max { S g ( P d 0 i , P s 0 j ) } , ( i , j = 0,1 , . . . , K 2 - 1 ) - - - ( 8 )

本发明还进一步考虑了树图的各级非退化完全子树之间的相似性。 对于某树图T的一个节点v,用T[v]表示以节点v为根的完全子树(节点 集合包括v及其所有子孙节点)。如果T[v]在数据结构上没有退化成链表, 且节点数大于2,且v至少有一个兄弟节点,则T[v]即为一个非退化完全 子树。如图7所示,该树图的0级非退化完全子树为自身T[v1]=T,1级 非退化完全子树有T[v2]、T[v3]和T[v4],2级非退化完全子树有T[v5]、T[v6] 和T[v7]。

假设Td共有0~m级非退化完全子树,Ts共有0~i级非退化完全子树。 对于某树图T,取其第i级非退化完全子树集合中与T最相似的那个元素 记为MS(T,i),则Td和Ts最终的几何轮廓相似度值计算公式为:

S 3 g ( T d , T s ) = Σ i = 0 min ( m , n ) S 3 g ( MS ( T d , i ) , MS ( T s , i ) ) min ( m , n ) , min ( m , n ) 0 0 , min ( m , n ) = 0 - - - ( 9 )

5)计算植物内部细节特征的相似度

本发明综合考虑各级子树的几何属性,如主干上枝条的平均轴向角 Sa、一级侧枝与主干的直径比Sd、整体宽高比Swh、二级侧枝与一级侧枝 的平均轴向角Sa1、一级侧枝与主干的横截面积比Ss1,从而计算出植物几 何细节的相似度。上述参数都是实值参数,本发明给出对两正数参数x 和y的相似度计算方法。不妨设x≥y,则参数x和y的相似度计算方法 定义为:

s ( x , y ) = 1 - | x 2 - y 2 | 2 xy , 1 x y < 2 + 1 0 , x y 2 + 1 - - - ( 10 )

例如两树Td和Ts的轴向角均值分别为θd和θs,根据式(10)即可得出 轴向角相似度Sa为:

Sa(Td,Ts)=s(θd,θs)   (11)

上式所得结果的范围是[0,1]。当相似度值为0时,表示这两个参数 因子完全不相似,为1时则表示他们完全相同。所以,相似度值越大,表 示待比较的两参数越相似。

采用类似的方法获得公式(3)中其它内部细节特征的相似度Sd,Swh, Sa1,Ss1。

6)计算最终的植物形态相似度

融合上述植株多特征信息,如植物的拓扑结构、外围轮廓形状、植 物内部细节特征,利用所求出的各种细节的相似度值,结合公式(5)、(9) 和权值因子,根据步骤(1)定义的公式(3),最终计算出不同植物结构间 的整体相似度。

本文发布于:2024-09-22 20:26:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/73127.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议