人参生态环境因子实时信号特征数据挖掘算法



1.本发明涉及的是一种数据挖掘算法,具体涉及一种高维混合属性人参生态环境因子实时信号特征数据挖掘算法。


背景技术:



2.人参的药用价值得到广泛认可,世界人参市场正在扩大,目前人参的供应主要依靠大田种植,生长周期长。人参不同于普通的植物,它们对生态环境因子和土壤因子要求很高,非常挑剔。因此应用植物精准栽培技术,推动药用植物科学发展,实现药用植物资源的可持续利用具有重要研究价值。然而在可持续温室几乎不受外界气候条件影响的环境下,采用精准特征挖掘方法,预测和控制人参生态环境因子的适宜条件,利用含有人参生长发育所需要的营养元素的有机基质来提供营养,使人参正常完成整个生命周期的种植,仅需要较短的栽培时间,期望以更少的能量获得更多的产量,可以进行人参周期性连续的工厂化生产的高效栽培种植方法,这一农业工程人参种植领域仍处于未开发阶段。解决缩短人参生长周期,通过模型高效周期性连续栽培,实时和准确推断生态环境因子信号特征参数,对预测栽培人参复杂物理过程的科学和工程学科非常具有意义。控制人参生长发育整个生命周期的行为,对无线传感器采集原有人参生态环境因子实时信号特征进行高度自动化挖掘分析起着至关重要的作用。然而生态环境因子实时信号特征挖掘过程中的关键环节就是聚类,经过聚类更好地对实时信号集中的信号参数对象进行理解。聚类不同于其它类别中所含的实时信号对象,实现各类别中的实时信号对象彼此相似,划分物理或者抽象的实时信号集为相似对象类别,需要有效的聚类算法以提高人参生态环境因子实时处理中的性能。利用预期生态环境因子信号的时间结构,允许检测到标准聚类方法无法检测到的非常微弱的人参生理、病理信号,各种规模的无线传感器的生态环境因子实时信号监测系统中实施。生态环境因子多特征数据聚类根据数据中每个节点的数据属性特征的优先级阈值对数据的加权距离进行分类,有效提高多特征数据异常行为检测实时性,将中心周围的多特征数据匹配成一个集。因此,本发明针对可持续温室中人参生态环境因子实时微弱信号多特征数据进行处理,可用于在合理的时间内将问题解决到最佳聚类成为众多学者研究的课题。
3.由于人参栽培的特殊性,栽培人参的形态变得与野生人参相似,人参的生长条件和栽培方法对于确定人参的质量至关重要。虽然kyung hee university的yue huo等人设计了植物内(盆栽试验)和体外(培养基试验)以研究人参中降低氧化应激和增强hm抗性的能力,仅从微观角度对重金属问题进行了研究。yun-soo kim等人提出物候研究是在栽培植物中实现更高生产力和更好作物质量的先决条件,重新定义人参物候生长阶段,但仅在传统栽参田间记录了人参物候特征的不同模式品种和移栽幼苗的过程。到目前为止,还没有人研究强调基于可持续温室基质立体栽培人参的方法。然而可持续温室系统生态环境因子实时信号如何影响植物生长发育,这在很大程度上是未知的。人参栽培生态系统具有相对稳定的自然植被动态,各种因素而表现出复杂的自然生态环境因子变化,使人参生态环境
因子实时信号进行生态特征聚类精准度挖掘就显得尤为重要,可以近乎实时地监控和检测人参生态系统状态的突然或逐渐变化,识别观察到的人参生态信号的区域偏离了预期的自然变化。但对于生态环境因子实时信号特征数据聚类算法的研究,解决局部最优解陷阱问题,增加异常人参生态环境因子数据判定与挖掘的准确性。其中文]daniel frank hesser等人提出的方法应用k-means聚类算法来标记现场测试数据和一个人工神经网络,未见解决k-means聚类算法缺陷问题。文献iain fairley等人使用k均值聚类将全球波资源划分为6类,但未集中精力优化设备以获取更多资源类别。文献rasim m.alguliyev等人提出了一种基于k-means算法的并行批聚类算法,但未发现实时信号特征数据挖掘研究。文献tiep m.hoang等人考虑使用单类支持向量机(oc-svm)和k均值聚类建立预测模型。文献amit kumar gangwar等人提出了一种基于k-均值聚类和加权k-近邻(k-nn)回归的传输线保护算法,仅验证算法对不同故障参数的鲁棒性。文献sicheng zhan等人提出了一种基于k-means的新型微波无损检测技术用于复合材料缺陷检测的无监督机器学习。文献rojalina priyadarshini等人使用修改的将单个大区域网络划分为多个集k-means聚类算法,虽然改进了k-means聚类算法,但未对实时信号进行特征数据挖掘。上述算法均未对k-means聚类算法初始参数依赖性较高,容易受噪声数据和离数据点的干扰,仅对球形状簇表现出较好的聚类性能,聚类数目k的值较为敏感,算法容易产生局部最优解等问题进行考虑,也未发现人参生态环境因子实时信号研究文献。
4.因此,本发明解决k-means聚类算法局部最优解陷阱问题,引入高维混合属性方法,结合人参生态环境因子实时信号特征数据。通过传统k-means聚类算法、差分进化的k-均值聚类算法和本发明算法进行比较,解决导致混合属性数据的挖掘效果较差,挖掘数据类型相对单一问题。本发明采用k-means聚类算法的高维混合属性数据挖掘方法进行研究,提升聚类精准度,探索高维混合属性数据相似度。依据分类型与数值型数据的度量形式,应用类异常因子,抑制挖掘阶段中的聚类中心点影响,k-means聚类算法中引入坐标旋转方法,针对传感器感知节点采集人参生态环境因子实时信号特征进行k-means聚类改进算法数据挖掘。


技术实现要素:



5.针对现有技术上存在的不足,本发明目的是在于提供一种高维混合属性人参生态环境因子实时信号特征数据挖掘算法,挖掘到的高维混合属性数据量与实际挖掘到的高维混合属性数据量误差较小,聚类挖掘性能优势显著。获取了全局最优的概率密度,达到聚类量化的人参生态环境温度[11.0,23.0]℃、环境湿度[30,60]%rh、地温(12.0~25.0]℃、地湿[39,50]%rh、光补偿点[400,10000](lux)和co2浓度[830,1140](ppm)等生态环境因子的适合生长条件,对智能控制可持续温室栽培人参智能化控制的实时信号反馈机制提供理论实践依据。
[0006]
为了实现上述目的,本发明是通过如下的技术方案来实现:人参生态环境因子实时信号特征数据挖掘算法,包括以下步骤:
[0007]
1、聚类算法中心参数初始化过程;
[0008]
2、聚类坐标旋转优化;
[0009]
3、k值聚类自动生成最大距离优化;
[0010]
4、k-means聚类算法人参生态环境因子实时信号特征数据挖掘实现。
[0011]
所述的步骤1具体包括:
[0012]
(1)假设选择的k个人参生态环境因子数据对象初始聚类中心,随机选取数据对象从数据集x内,中心点分别是{c1,c2,

,ck}初始聚类,需划分类别明确数据集个数。
[0013]
(2)假设人参生态环境因子实时信号特征数据x
p
分类至ci类别内,数据x
p
与中心点ci距离最近,产生中心是k个初始中心点的类,完成各数据对象与最近类别的分类,求取数据集的其余数据对象与k个初始中心点间距。
[0014]
(3)重新求解取得实现各聚类中心点表达式如下
[0015][0016]
(4)迭代(2)和(3)两个步骤,聚类收敛,待计算后聚类中心点与计算前一致,迭代结束。
[0017]
(5)输出聚类结果。
[0018]
所述的步骤2具体包括:(1)数据集x内已知有n条数据存在,所有数据的间距为集合p,最大间距为dm。
[0019]
(2)dm对应数据a和b,对半径进行计算,获取数据间的中心点坐标c的位置。
[0020]
(3)第二个中心点就是数据集x内与点d间距最小的数据,起始参照点是首个中心点,根据圆心角即可获得点d,将其中一个数据设定成首个中心点,半径是圆心是c。
[0021]
(4)需要进行下一步时,聚类中心点数量与k值相等;不足k值时返回(3),将起始参照点设定为点d,满足k值后结束。
[0022]
(5)k个聚类中心点的初始中心点,利用k-means与距离公式欧几里得算法,划分数据集x聚类。
[0023]
所述的步骤3具体包括:(1)假设含有x个人参生态因子实时信号特征数据的数据集为x
x
={a1,a2,

,a
x
},最远间距为d
ij
,且i、j≤x,ai=s1、aj=s2,初始聚类中心应选取间距最大的两数据。
[0024]
(2)通过距离欧几里得公式人参生态因子实时信号特征数据与中心点ai更远时则归属至s2,否则归属于s1,产生类别s
11
与s
12
,最终完成剩余数据与初始聚类中心分类。
[0025]
(3)获得最远距离d
11
,即类别s
11
人参生态因子实时信号特征数据与s1的所有间距。将两个最大间距中的较大距离设定成d1,类别s
12
中人参生态因子实时信号特征数据与s2的最大间距d
12
,其相应数据则是s3。
[0026]
(4)若d1≥hd
ij
,参数h比较d
ij
与d1大小,可得类别s
31
、s
32
以及s
33
,认为第三个聚类中心是s3。
[0027]
(5)获得最远距离d
12
从类别s
31
人参生态因子实时信号特征数据与s1的所有间距中得到,然而可得类别s
32
、s
33
中人参生态因子实时信号特征数据与s2、s3的最大间距d
22
、d
23
,相应人参生态因子实时信号特征数据则是s4,较大距离设定成d2将三个最大间距。
[0028]
(6)针对公式(17)进行判定
[0029][0030]
若满足判定式则返回步骤(4),若不满足生成三个类别,计算终止。
[0031]
所述的步骤4具体包括:(1)通过距离欧几里得公式,读取整个人参生态环境因子实时信号特征数据集p,当读取到人参生态环境因子实时信号特征数据集末端时,评估结束。利用该数据的极小值与极大值来标准化其高维混合属性对新数据pi进行读取,得到最近间距d
min
(p,g)与类别ci,解得类别ci=(i∈(1,k))与数据pi的间距d(p,gi)。
[0032]
(2)重新对人参生态环境因子实时信号特征新的数据进行读取,判定数据pi属于异常数据,此时间距最小值大于已知聚类半径
[0033]
(3)间距最小值不足聚类半径,重新进行异常判定,人参生态环境因子实时信号特征数据标记为ej。
[0034]
本发明高维混合属性人参生态环境因子实时信号特征数据挖掘算法挖掘,无任意标号的条件,作为一种简单的无监督学习方法引入传统k-means聚类算法作为主要求解算法,采取持续迭代下降策略,完成数据集的聚类。
[0035]
本发明的有益效果:
[0036]
(1)与传统k-means聚类算法、差分进化的k-均值聚类算法相比,每次迭代过程中在时间效率上都优于现有算法,本发明算法加入坐标旋转优化,获取最优的聚类结果,短时间就发挥出极佳的性能,
[0037]
(2)传统k-means聚类算法、差分进化的k-均值聚类算法挖掘到的高维混合属性数据量与实际挖掘到的高维混合属性数据量误差较大,而本发明算法通过降序排列类别异常因子,挖掘到的高维混合属性数据量与实际挖掘到的高维混合属性数据量误差较小,聚类挖掘性能优势显著,大幅度降低挖掘误差。
[0038]
(3)通过本发明算法聚类量化分析了人参生长最佳环境数据实时信号,获取了全局最优的概率密度,智能控制可持续温室环境温度(℃)、环境湿度(%rh)、地温(℃)、地湿(%rh)、光照(lux)、co2(ppm)影响因子特征概率密度分别为[0.001,0.0048]、[0.009,0.058]、[0.001,0.018]、[0.01,0.21]、[0.28,0.38]、[0.001,0.028],达到聚类量化适合生长条件,以便对无线传感器实时信号反馈控制提供参考。
附图说明
[0039]
下面结合附图和具体实施方式来详细说明本发明;
[0040]
图1为本发明的智能控制可持续立体基质栽培温室示意图;
[0041]
图2为本发明的算法流程图;
[0042]
图3为本发明实施例的人参生态环境信息数据高维混合属性数据样本采集聚类结果示意图;
[0043]
图4为本发明实施例不同算法迭代阶段的运行时间比较示意图;
[0044]
图5为本发明实施例不同算法实时信号特征数据挖掘误差对比示意图;
[0045]
图6为本发明实施例环境温度(℃)特征属性概率密度示意图;
[0046]
图7为本发明实施例环境湿度(%rh)特征属性概率密度示意图;
[0047]
图8为本发明实施例地温(℃)特征属性概率密度示意图;
[0048]
图9为本发明实施例地湿(%rh)特征属性概率密度示意图;
[0049]
图10为本发明实施例光照(lux)特征属性概率密度示意图;
[0050]
图11为本发明实施例co2(ppm)特征属性概率密度示意图。
具体实施方式
[0051]
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
[0052]
参照图1-2,本具体实施方式采用以下技术方案:智能控制可持续立体基质栽培温室,通过并网太阳能光伏板,控制温度、湿度、地温、地湿、光照、co2等参数,使内部小气候实时信号适应更接近人参的最佳生长条件,智能控制可持续温室立体栽培人参如图1所示。
[0053]
人参生态环境因子实时信号特征数据挖掘算法,包括以下步骤:
[0054]
1聚类算法中心参数初始化过程
[0055]
通过设置k-means聚类算法中心点的过程,持续迭代计算数据对象聚类,k-means聚类算法下高维混合属性数据挖掘运算流程描述如下。
[0056]
(1)假设选择的k个人参生态环境因子数据对象初始聚类中心,随机选取数据对象从数据集x内,中心点分别是{c1,c2,

,ck}初始聚类,需划分类别明确数据集个数。
[0057]
(2)假设人参生态环境因子实时信号特征数据x
p
分类至ci类别内,数据x
p
与中心点ci距离最近,产生中心是k个初始中心点的类,完成各数据对象与最近类别的分类,求取数据集的其余数据对象与k个初始中心点间距。
[0058]
(3)重新求解取得实现各聚类中心点表达式如下
[0059][0060]
(4)迭代(2)和(3)两个步骤,聚类收敛,待计算后聚类中心点与计算前一致,迭代结束。
[0061]
(5)输出聚类结果。
[0062]
2聚类坐标旋转优化
[0063]
获取初始中心点,可利用坐标旋转方法,防止出现局部最优解问题,稳定聚类结果,计算流程可以描述如下。
[0064]
(1)数据集x内已知有n条数据存在,所有数据的间距为集合p,最大间距为dm。
[0065]
(2)dm对应数据a和b,对半径进行计算,获取数据间的中心点坐标c的位置。
[0066]
(3)第二个中心点就是数据集x内与点d间距最小的数据,起始参照点是首个中心点,根据圆心角即可获得点d,将其中一个数据设定成首个中心点,半径是圆心是c。
[0067]
(4)需要进行下一步时,聚类中心点数量与k值相等;不足k值时返回(3),将起始参照点设定为点d,满足k值后结束。
[0068]
(5)k个聚类中心点的初始中心点,利用k-means与距离公式欧几里得算法
[31]
,划
分数据集x聚类。
[0069]
因此,防止发生类别中没有中心点或者超出一个中心点,实现聚类中心点散布于各类别,通过旋转坐标使初始聚类中心不再进行随机选择。
[0070]
3、k值聚类自动生成最大距离优化
[0071]
最大距离自动生成k值策略通过扫描全部人参生态因子实时信号特征数据,提升了k-means算法的可行性,明确k的大小。新增加类别中心点为距离最远的数据对象,根据距离欧几里得完成剩余数据与两类别的划分,设置初始聚类中心为最远距离的两个数据,待符合终止条件,则要重新分类全部数据,循环结束。自动生成k值策略依据最大距离原理,其算法具体流程如下。
[0072]
(1)假设含有x个人参生态因子实时信号特征数据的数据集为x
x
={a1,a2,

,a
x
},最远间距为d
ij
,且i、j≤x,ai=s1、aj=s2,初始聚类中心应选取间距最大的两数据。
[0073]
(2)通过距离欧几里得公式人参生态因子实时信号特征数据与中心点ai更远时则归属至s2,否则归属于s1,产生类别s
11
与s
12
,最终完成剩余数据与初始聚类中心分类。
[0074]
(3)获得最远距离d
11
,即类别s
11
人参生态因子实时信号特征数据与s1的所有间距。将两个最大间距中的较大距离设定成d1,类别s
12
中人参生态因子实时信号特征数据与s2的最大间距d
12
,其相应数据则是s3。
[0075]
(4)若d1≥hd
ij
,参数h比较d
ij
与d1大小,可得类别s
31
、s
32
以及s
33
,认为第三个聚类中心是s3。
[0076]
(5)获得最远距离d
12
从类别s
31
人参生态因子实时信号特征数据与s1的所有间距中得到,然而可得类别s
32
、s
33
中人参生态因子实时信号特征数据与s2、s3的最大间距d
22
、d
23
,相应人参生态因子实时信号特征数据则是s4,较大距离设定成d2将三个最大间距。
[0077]
(6)针对公式(17)进行判定
[0078][0079]
若满足判定式则返回步骤(4),若不满足生成三个类别,计算终止。
[0080]
4、k-means聚类算法人参生态环境因子实时信号特征数据挖掘实现
[0081]
通常数据的噪声、高维和数据稀疏性的存在阻碍纵向人参微组信号推断和零检测,可以平滑的从噪声数据中观察到数据信号特征轨迹。假设类别c里的元素数量比已知的noise count少,属于噪音类别,聚类结果进行异常标记,利用降噪处理获取,集合c={c1,c2,

,ck}各类别类异常因子采用界定类别公式如下。
[0082][0083]
通过计算满足公式(18)不等式的b1极大值,解决全部非噪音类别问题,设定数据集的异常数据比例是β,求取各类别的异常因子并降序排列。
[0084][0085]
公式(19)中得到的b1值,{e
b1+1
,

,ek}属于正常类别,对异常人参生态环境因子实时信号特征数据{e1,e2,

,e
b1
}进行标记挖掘。通过评估人参生态环境因子实时信号特征数据集p,结合非噪音类别中心与特征数据标记,具体评估流程如下。
[0086]
(1)通过距离欧几里得公式,读取整个人参生态环境因子实时信号特征数据集p,当读取到人参生态环境因子实时信号特征数据集末端时,评估结束。利用该数据的极小值与极大值来标准化其高维混合属性对新数据pi进行读取,得到最近间距d
min
(p,g)与类别ci,解得类别ci=(i∈(1,k))与数据pi的间距d(p,gi)。
[0087]
(2)重新对人参生态环境因子实时信号特征新的数据进行读取,判定数据pi属于异常数据,此时间距最小值大于已知聚类半径
[0088]
(3)间距最小值不足聚类半径,重新进行异常判定,人参生态环境因子实时信号特征数据标记为ej。
[0089]
因此,提出人参生态环境因子实时信号特征聚类精准挖掘算法,该算法与其他方法的区别在于通过旋转坐标使初始聚类中心不再进行随机选择。除此之外,综合考虑人参生态环境因子的实时信号数据,出最优聚类结果,实时反馈控制人参生长最佳环境数据信号。
[0090]
实施例1;仿真实验参数及样本采集聚类结果
[0091]
1.1、仿真实验参数
[0092]
仿真环境采用python验证高维混合属性改进的k-means聚类人参生态环境因子实时信号特征模型数据挖掘算法的性能,将本发明算法与传统k-means聚类算法、差分进化的k-均值聚类算法的高维混合属性数据量人参田间生态环境因子聚类结果进行对比分析,验证基于k-means聚类算法的高维混合属性数据挖掘方法在实际应用中的性能,实验数据对象从人参生态环境信息数据中随机抽取,仿真参数设置如表1所示。
[0093]
表1仿真参数设置
[0094][0095]
表1仿真数据信息统计来自吉林省抚松县人参栽培基地,基地采用无线传感器网络通信技术,通过传感器每间隔10分钟对人参基质栽培基地的人参生态环境信息数据。其中x表示表示数据集x内已知有n条数据,ej表示实时信号特征,pi表示采集样本数据,人参生态环境因子实时信号特征数据如表2所示。
[0096]
表2人参生态环境因子实时信号特征数据
[0097][0098]
[0099]
[0100]
[0101][0102]
表2中选取人参生态环境无线网络传感器采集2021年11月1日16:30:00至2022年8月15日9:10:00的12956组人参生态环境信息数据,试验数据包括采集时间、温度(℃)、湿度(%rh)、地温(℃)、地湿(%rh)、光照(lux)、co2(ppm)。
[0103]
1.2、样本采集聚类结果
[0104]
通过本发明算法的高维混合属性数据进行样本采集,人参生态环境信息数据高维混合属性样本采集聚类结果图3所示。
[0105]
图3中高维混合属性数据样本采集聚类人参生态环境信息,利用评估指标求解对应的值,采集样本8644组数据,样本个数占比66.72%。聚类分析后的数据与回传初始数据进行对比运算,每百个初始数据中清洗保留了多少数据除以一百得到采样率,每个点代表每百数据的采样率,纵坐标为采样率,横坐标为时间。
[0106]
2仿真实验结果及分析
[0107]
2.1不同算法迭代阶段的运行时间比较
[0108]
通过高维混合属性数据样本采集的人参生态环境实时信号,聚类结果的数据相似度与指标呈正相关,本发明算法、传统k-means聚类算法、差分进化的k-均值聚类算法在运行实际效率上进行实验对比结果图4所示。
[0109]
图4中曲线走势的数据可以看出用本发明算法、传统k-means聚类算法和差分进化的k-均值聚类算法对清洗后的数据进行数据标准化,每个点代表一个数据。本发明算法在每次迭代过程中在时间效率上都优于传统k-means聚类算法、差分进化的k-均值聚类算法,维度越大,效果越明显。传统k-means聚类算法和差分进化的k-均值聚类算法在处理属性数量较少的数据集时聚类效果相对较好,但仍远不及本发明算法的聚类效果与稳定性。验证了本发明算法以较快的速度获得全局最优值,具有良好的寻优能力和更好的鲁棒性。传统k-means聚类算法和差分进化的k-均值聚类算法的高维混合属性数据聚类结果较本发明算法的高维混合属性数据聚类结果差,本发明算法加入坐标旋转优化,获取最优的聚类结果,短时间就发挥出极佳的性能。
[0110]
2.2不同算法实时信号特征数据挖掘误差对比
[0111]
采用传统k-means聚类算法、差分进化的k-均值聚类算法与本发明算法挖掘高维混合属性数据,结合聚类效果会直接影响数据的挖掘结果,将挖掘结果与实际的挖掘结果进行误差对比,不同算法实时信号特征数据挖掘误差对比图5所示。
[0112]
图5通过本发明算法、传统k-means聚类算法、差分进化的k-均值聚类算法挖掘得到的数据量减去真实数据得到挖掘误差的相反数,再进行相反数运算得到挖掘误差,横坐标为数据量。曲线走势可以看出传统k-means聚类算法、差分进化的k-均值聚类算法挖掘到
的高维混合属性数据量与实际挖掘到的高维混合属性数据量误差较大,本发明算法通过降序排列类别异常因子,挖掘到的高维混合属性数据量与实际挖掘到的高维混合属性数据量误差较小,挖掘效果好,聚类挖掘性能优势显著,大幅度降低挖掘误差。
[0113]
2.3聚类结果量化分析
[0114]
通过本发明算法在聚类向量中看到样本所属的取值区间,计算出各个数据的出现次数,并除以总数据长度,获得图6至图11的概率密度曲线。横坐标为排序后的数据,纵坐标为各数据对应的概率密度,比较环境温度(℃)、环境湿度(%rh)、地温(℃)、地湿(%rh)、光照(lux)、co2(ppm)取值时的聚类结果,出最优聚类结果,为反馈控制提供人参生态环境最优实时信号数据特征。
[0115]
(1)环境温度(℃)实时信号特征聚类量化
[0116]
人参生长发育期间,叶温达30~33℃时,叶片就会出现日灼烧(俗称日烧),枯萎脱落。在36℃以上的烈日下叶子焦枯,低于-6℃茎秆会失去生长机能,温度(℃)特征属性概率密度图6所示。
[0117]
图6中曲线可以看出智能控制可持续温室通过温湿度控制器[29]使环境温度调整在[11.0,29.0)℃区间,而在[23.0,29.0]区间内概率密度无限接近于0.00,叶片未出现枯萎脱落和焦枯现象;由于温室最低温度11.0℃,也未出现人参秸秆失去生长机能状况。温室环境温度智能控制在[11.0,23.0]℃区间,其影响因子特征概率密度[0.001,0.0048]达到最优聚类量化生长状态。
[0118]
(2)环境湿度(%rh)实时信号特征聚类量化
[0119]
人参对水分要求比较严格,既喜水又怕涝。智能控制可持续温室环境水分过大,湿度超过60%,就会造成土壤中的空气不足,使人参根系呼吸受到影响,易染病害和烂根。持续温室环境水分过小,湿度低于30%以下时会造成人参根系水分扩散,使人参须根干枯,导致产量下降。湿度(%rh)特征属性概率密度图7所示。
[0120]
图7中曲线可以看出人参生长发育时智能控制可持续温室通过温湿度控制器使环境湿度在[30,60]%rh区间内取值范围,未出现环境湿度大于60%rh或者小于30%r情况,人参生长过程中染病害和烂根、人参须根干枯状态不会出现,环境湿度(%rh)影响因子特征概率密度在[0.009,0.058]达到最优聚类量化生长状态。
[0121]
(3)地温(℃)实时信号特征聚类量化
[0122]
人参生长发育时地温高于30℃或低于10℃时人参处于休眠状态,地温(℃)特征属性概率密度如图8所示。
[0123]
图8中曲线可以看出智能控制可持续温室地温在(12.0~25.0]℃区间内,未出现地温高于30℃或低于10℃的情况,智能控制可持续温室人参处于休眠状态不存在,适宜地温特征影响因子特征概率密度在[0.001,0.018]达到最优聚类量化生长状态。
[0124]
(4)地湿(%rh)实时信号特征聚类量化
[0125]
人参在生长的过程当中水分也是非常重要的,而且对于水分的要求非常严格,土壤过湿或者过于干旱,会减少人参的产量,增加病害。春季出苗期土壤湿度保持在40%左右,夏季生长期保持在45%~50%,秋季保持在40%~50%为宜,全年生长发育期湿度范围以40%~50%为好,地湿(%rh)特征属性概率密度如图9所示。
[0126]
图9中曲线可以看出地湿(%rh)特征属性在小于39%rh和大于50%rh时概率密度
未出现,因此不存在土壤过湿或者过于干旱现象,并且基质栽培人参,病害情况基本为零。智能控制可持续温室春季地湿在[39,41]%rh区间内,夏季地湿在保持在[45,50]%rh区间内,秋季保持在[40,50]%rh区间内,全年生长发育期持续温室湿度范围保持在[39,50]%rh区间,地湿(%rh)特征属性概率密度达到最优[0.01,0.21]、[0.047,0.05]、[0.02,0.05]、[0.01,0.05]聚类量化生长条件。
[0127]
(5)光照(lux)实时信号特征聚类量化
[0128]
人参为阴性植物,对光的要求较严格,人参生育的最合适光强,随纬度和气温而变,纬度高气温低所需光强大,反之则小。人参的光补偿点约400lx,由400lx至10klx。光照(lux)特征属性概率密度如图10所示。
[0129]
图10中曲线可以看出智能控制可持续温室通过led补光灯智能控制人参的光补偿点[400,10000](lux)区间内,夜晚无室外阳光情况下智能控制光补偿点400lux,白天根据天气情况智能控制在10klx以内,光照(lux)特征概率密度达到[0.28,0.38]最优聚类量化生长条件。
[0130]
(6)co2(ppm)实时信号特征聚类量化
[0131]
精准农业特别是智能控制可持续温室对co2的需求量巨大,co2是植物进行光合作用的主要原料,是绿植物生长发育必须的“粮食”。人参最适宜的co2浓度为800ppm~1400ppm,而空气中co2的浓度400ppm,缺少部分通过施用有机基质肥料,被微生物分解过程中产生的co2对人参生长起到了促进作用,co2(ppm)特征属性概率密度如图11所示。
[0132]
图11中曲线可以看出,智能控制可持续温室内通过增施有机基质肥料增加co2600ppm,使人参生态环境的co2浓度智能控制在[830,1140](ppm)区间内,co2(ppm)特征概率密度达到[0.001,0.028]最优聚类量化生长条件。
[0133]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

技术特征:


1.人参生态环境因子实时信号特征数据挖掘算法,其特征在于,包括以下步骤:(1)、聚类算法中心参数初始化过程;(2)、聚类坐标旋转优化;(3)、k值聚类自动生成最大距离优化;(4)、k-means聚类算法人参生态环境因子实时信号特征数据挖掘实现。2.根据权利要求1所述的人参生态环境因子实时信号特征数据挖掘算法,其特征在于,所述的步骤(1)具体包括:(1)假设选择的k个人参生态环境因子数据对象初始聚类中心,随机选取数据对象从数据集x内,中心点分别是{c1,c2,

,c
k
}初始聚类,需划分类别明确数据集个数;(2)假设人参生态环境因子实时信号特征数据x
p
分类至c
i
类别内,数据x
p
与中心点c
i
距离最近,产生中心是k个初始中心点的类,完成各数据对象与最近类别的分类,求取数据集的其余数据对象与k个初始中心点间距;(3)重新求解取得实现各聚类中心点表达式如下(4)迭代(2)和(3)两个步骤,聚类收敛,待计算后聚类中心点与计算前一致,迭代结束;(5)输出聚类结果。3.根据权利要求1所述的人参生态环境因子实时信号特征数据挖掘算法,其特征在于,所述的步骤(2)具体包括:(1)数据集x内已知有n条数据存在,所有数据的间距为集合p,最大间距为d
m
;(2)d
m
对应数据a和b,对半径进行计算,获取数据间的中心点坐标c的位置;(3)第二个中心点就是数据集x内与点d间距最小的数据,起始参照点是首个中心点,根据圆心角即可获得点d,将其中一个数据设定成首个中心点,半径是圆心是c;(4)需要进行下一步时,聚类中心点数量与k值相等;不足k值时返回(3),将起始参照点设定为点d,满足k值后结束;(5)k个聚类中心点的初始中心点,利用k-means与距离公式欧几里得算法,划分数据集x聚类。4.根据权利要求1所述的人参生态环境因子实时信号特征数据挖掘算法,其特征在于,所述的步骤(3)具体包括:(1)假设含有x个人参生态因子实时信号特征数据的数据集为x
x
={a1,a2,

,a
x
},最远间距为d
ij
,且i、j≤x,a
i
=s1、a
j
=s2,初始聚类中心应选取间距最大的两数据;(2)通过距离欧几里得公式人参生态因子实时信号特征数据与中心点a
i
更远时则归属至s2,否则归属于s1,产生类别s
11
与s
12
,最终完成剩余数据与初始聚类中心分类;(3)获得最远距离d
11
,即类别s
11
人参生态因子实时信号特征数据与s1的所有间距;将两个最大间距中的较大距离设定成d1,类别s
12
中人参生态因子实时信号特征数据与s2的最大间距d
12
,其相应数据则是s3;
(4)若d1≥hd
ij
,参数h比较d
ij
与d1大小,可得类别s
31
、s
32
以及s
33
,认为第三个聚类中心是s3;(5)获得最远距离d
12
从类别s
31
人参生态因子实时信号特征数据与s1的所有间距中得到,然而可得类别s
32
、s
33
中人参生态因子实时信号特征数据与s2、s3的最大间距d
22
、d
23
,相应人参生态因子实时信号特征数据则是s4,较大距离设定成d2将三个最大间距;(6)针对公式(17)进行判定若满足判定式则返回步骤(4),若不满足生成三个类别,计算终止。5.根据权利要求1所述的人参生态环境因子实时信号特征数据挖掘算法,其特征在于,所述的步骤(4)具体包括:(1)通过距离欧几里得公式,读取整个人参生态环境因子实时信号特征数据集p,当读取到人参生态环境因子实时信号特征数据集末端时,评估结束;利用该数据的极小值与极大值来标准化其高维混合属性对新数据p
i
进行读取,得到最近间距d
min
(p,g)与类别c
i
,解得类别c
i
=(i∈(1,k))与数据p
i
的间距d(p,g
i
);(2)重新对人参生态环境因子实时信号特征新的数据进行读取,判定数据p
i
属于异常数据,此时间距最小值大于已知聚类半径(3)间距最小值不足聚类半径,重新进行异常判定,人参生态环境因子实时信号特征数据标记为e
j


技术总结


本发明公开了一种人参生态环境因子实时信号特征数据挖掘算法,包括以下步骤:1、聚类算法中心参数初始化过程;2、聚类坐标旋转优化;3、k值聚类自动生成最大距离优化;4、K-Means聚类算法人参生态环境因子实时信号特征数据挖掘实现。本发明挖掘到的高维混合属性数据量与实际挖掘到的高维混合属性数据量误差较小,聚类挖掘性能优势显著。获取了全局最优的概率密度,达到聚类量化的人参生态环境温度[11.0,23.0]℃、环境湿度[30,60]%RH、地温(12.0~25.0]℃、地湿[39,50]%RH、光补偿点[400,10000](Lux)和CO2浓度[830,1140](ppm)等生态环境因子的适合生长条件,对智能控制可持续温室栽培人参智能化控制的实时信号反馈机制提供理论实践依据。机制提供理论实践依据。机制提供理论实践依据。


技术研发人员:

李长城 陈德运 解成俊 高一龙 李上飞 马文彬 朴仁哲 陈飞宇

受保护的技术使用者:

吉林农业科技学院

技术研发日:

2022.09.01

技术公布日:

2022/12/9

本文发布于:2024-09-22 03:52:33,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/34427.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:人参   数据   因子   算法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议