一种基于人工智能的乳腺采样数据的处理方法与流程



1.本发明涉及文本分类领域,具体为一种基于人工智能的乳腺采样数据的处理方法。


背景技术:



2.目前医学检测中图像临床检测手段的检查范围比较广泛,适用于身体多个器官,可以用于多种疾病检查,早发现、早能够及时恢复人体健康。现在的图像临床检测手段主要有核磁共振成像、多普勒超声成像和计算机断层摄影技术等,这些技术发展多年,成熟稳定,但此类医学影像技术时间分辨率低、设备大和有电离辐射等因素,无法对肺部组件进行实时成像监测。
3.电阻抗断层成像技术对人体损伤小,成本低廉,且可以实现实时成像。经过近四十年的发展,电阻抗断层成像技术的激励信号由单频激励发展为多频激励,激励信号采用电流信号;前端采集平台由模拟技术为主转换为以数字技术为主,特别是在信号的检测阶段,往往通过高速模数转换电路采集之后进行数字信号处理。在图像重构方面近年来加入了人工智能的处理方法,旨在提升成像的分辨率。但目前的电阻抗断层成像系统成像过程中普遍存在非线性、病态性和不适定性等技术难题导致了成像质量效果不够理想和成像分辨率低,在临床上还没有得到较好的应用。
4.在现有技术中,专利cn202210153549公开了一种乳腺癌特征信息识别方法,根据获取病人在电子病历系统中的病人特征数据,根据机器学习算法和神经动力学方法等方法,有效地提高了乳腺癌分类识别上的准确率。但是这个方法选取的特征数据是医学图像数据的分析结果,数据获取的流程复杂。
5.因此,寻一种能够减少病人检测流程,提高乳腺肿瘤分类识别的准确率,并为医生的诊断提供有效数据支撑的方法是本领域技术人员亟待解决的技术问题。


技术实现要素:



6.针对上述现有技术的不足,本发明的目的在于提供一种基于人工智能的乳腺采样数据的处理方法,包括以下步骤:
7.根据待检测病人体外激励频率收集人体乳腺部分的电阻率数据;
8.对所述电阻率数据进行处理,得到对应的四维输入数据;
9.将所述输入数据输入文本分类模型中,其中所述文本分类模型包括特征提取部分和类别分类部分,所述输入数据依次进行特征提取和类别分类;
10.所述输入数据经过文本分类模型后输出,判断输出数据是否出现异常。
11.在本发明的一实施方式中,所述特征提取部分为伪孪生的特征提取网络,所说伪孪生的特征提取网络包括第一分支、第二分支、第一全连接层和第二全连接层,具体步骤如下:
12.将所述输入数据分别输入第一分支和第二分支进行特征提取,得到第一分支的输
张量和第二分支的输出张量;
13.将所述第一分支输出张量和第二分支输出张量合并,得到第三输出张量,对所述第三输出张量进行降维处理,得到第四输出张量;
14.将所述第四输出张量依次进行第一全连接层和第二全连接层操作,得到特征提取的输出张量。
15.在本发明的一实施方式中,所述第一分支是基于transformer结构的特征提取,所述第一分支的特征提取包括:所述输入数据依次通过5个transformer层,再经过1个5
×
5深度可分离卷积,得到所述第一分支的输出张量。
16.在本发明的一实施方式中,所述transformer层的具体操作如下:
17.将所述输入数据先经过多头注意机制子层,得到第一输出张量;
18.将所述第一输出张量进行线性变化,并使用sigmoid激活函数进行激活,得到所述多头注意机制的输出张量;
19.将所述多头注意机制的输出张量进行神经元随机失活,得到第二输出张量;
20.将所述第二输出张量与所述输入数据张量相加,得到transformer层第一部分输出张量;
21.将所述transformer层第一部分输出张量进入前馈全连接层进行处理,并对所述前馈全连接层的输出张量进行神经元随机失活,得到所述transformer层第二部分输出张量;其中所述前馈全连接层包括第一全连接子层和第二全连接子层;
22.将所述transformer第一部分输出张量和所述transformer层第二部分输出张量相加,得到transformer层的输出张量。
23.在本发明的一实施方式中,将所述transformer层第一部分输出张量进入前馈全连接层进行处理包括:
24.将所述transformer层第一部分输出张量进入第一全连接子层进行全连接层操作,并使用relu函数进行激活;
25.将激活后的第一全连接子层输出张量进行神经元随机失活;
26.将随机失活后的所述第一全连接子层输出张量再进入第二全连接子层进行全连接层操作,使用sigmoid函数进行激活,得到所述前馈全连接层的输出张量。
27.在本发明的一实施方式中,第二分支是基于全卷机网络的特征提取,所述第二分支包括若干个卷积块,将所述输入张量依次输入所述卷积块中进行处理,得到所述第二分支的输出张量。
28.在本发明的一实施方式中,所述卷积块的处理步骤如下:
29.将所述输入张量先进行1
×
1卷积,再进行1个3
×
3深度可分离卷积,然后进行1个1
×
1卷积,最后进行神经元随机失活,得到所述第二分支的输出张量。
30.在本发明的一实施方式中,所述类别分类包括将所述特征提取的输出张量采用随机森林分类算法进行类别分类,生成多个类别,并采用投票的方式投出最多票数的类别为最终类别。
31.在本发明的一实施方式中,所述随机森林算法的具体步骤如下:
32.对所述特征提取的输出张量进行n次有放回的采样,形成n个样本,所述n为收集人体乳腺部分的电阻率数据的个数;
33.所述每个样本中含有m个属性,随机抽取m个属性进行分类,其中m<<m;
34.将所述m个属性按照从小到大递增排列,通过计算信息熵和最终信息增益,选出所述m个属性中最终信息增益最大的属性作为最终分裂点;
35.对所述最终分裂点进行分裂,并针对所述最终分裂点的分裂结果进行预测标记,根据投票法上选出得票数最高的标记,并输出此标记结果;
36.其中,所述信息熵的计算公式如下:
[0037][0038][0039]
公式中m表示作为分裂属性节点的所有样本同一属性值,avg(mi,mj)表示对进行从小到大排序后相邻的两个属性值求均值,ny表示样本标签y等于相应值时的数量,py表示样本标签y等于相应值时的概率;
[0040]
所述最终信息增益的计算公式如下:
[0041][0042]
公式中d是训练的样本空间,|d|表示训练样本个数,表示训练样本中相应属性值大于分裂属性值的样本个数,表示训练样本中相应属性值小于分裂属性值的样本个数。
[0043]
一种电子设备,包括存储器和处理器,所述处理器用于执行所述存储器中存储的文本分类模型,以实现上述任意一项所述的一种基于人工智能的乳腺采样数据的处理方法。
[0044]
与现有技术相比,本发明能够取得下列有益效果:
[0045]
1、本技术通过使用生物电阻抗信息收集平台收集人体乳腺部分的电阻率数据,通过对电阻率数据进行处理,并使用伪孪生的特征提取网络对数据进行特征提取,将伪孪生的特征提取网络的特征提取结果进行信息融合,并将融合后的信息进行全连接层操作,以获取数据之间更多的信息关联,并利用机器学习数据,扩大数据之间的差异,使数据特征明显,以便于对数据进行分类。
[0046]
2、本技术采用随机森林算法建立分类器,对特征提取结果进行分类,通过计算信息熵和最终信息增益的方式选出最终分裂点进行分裂,并针对最终分裂点的分裂结果进行预测标记,根据投票法选出票数最高的标记,根据输出的标记结果判断数据是否出现异常,提高了判断的准确率,同时减少了待测病人的检测流程,无需拍片或生成图像,极大便利了医生和病人,有效提高工作效率。
附图说明
[0047]
图1为本发明一实施方式的一种基于人工智能的乳腺采样数据的处理方法的流程
图;
[0048]
图2为本发明一实施方式的特征提取部分的流程图;
[0049]
图3为本发明一实施方式的transformer结构的操作流程图;
[0050]
图4为本发明一实施方式的类别分类部分的流程图。
具体实施方式
[0051]
为了使本领域的技术人员更好地理解本技术中的技术方案,下面将结合本技术实施例中的附图对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0052]
需要说明的是,当元件被称为“固定于”或“设置于”另一个部件上,它可以直接在另一个部件上或者间接设置在另一个部件上;当一个部件被称为是“连接于”另一个部件,它可以是直接连接到另一个部件或间接连接至另一个部件上。
[0053]
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本技术和简化描述,而不是指示或暗示所指的装置或部件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术的限制。
[0054]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本技术的描述中,“多个”、“若干个”的含义是两个或两个以上,除非另有明确具体的限定。
[0055]
须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本技术可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本技术所能产生的功效及所能达成的目的下,均应仍落在本技术所揭示的技术内容得能涵盖的范围内。
[0056]
如图1所示,本发明一优选实施方式提供一种基于人工智能的乳腺采样数据的处理方法,包括以下步骤:
[0057]
s1:根据待检测病人体外激励频率收集人体乳腺部分的电阻率数据。
[0058]
在本技术实施例中,使用生物电阻抗信息收集平台收集不同体外激励频率下待检测病人的乳腺部分电阻率数据,优选的,对待检测病人的检测范围是以乳腺为中心,直径为5厘米的圆形区域,体外激励频率是从10000hz逐渐增加到30000hz,激励源的频率分别为:10000,11074.14,13623.34,17327.13,21293.6,26168.07,32158.38,39519.98,40901.3,50264.29,59684.52,73347.3,90137.74,131531.95,161641.83,198644.36,244117.41,281641.83,300000,单位是赫兹(hz),而每一个激励源下测得的病人乳腺处的电阻率的单位是欧姆
·
厘米(ω
·
cm),每一个病人的检测数据有多个。
[0059]
s2:将所述电阻率数据进行处理,得到对应的四维输入数据。
[0060]
在本技术实施例中,将所述收集的电阻率数据进行类型转换,并采用词嵌入的方
式将所述电阻率数据转换为二维数据,在所述二维数据的第一维前添加维度为1的维度,将所述二维数据转换为三维数据,并采用维度映射的方式将所述三维数据转换为四维数据。
[0061]
s3:将所述输入数据输入文本分类模型中,其中文本类型模型分为特征提取部分和类别分类部分,所述输入数据依次进行特征提取和类别分类。通过对输入数据进行特征提取,可以获得更多文本之间的关联信息,使数据之间的关联性更强,并通过类别分类后,可以根据类别分类的结果直接判断数据是否异常,减少了病人检测的流程。
[0062]
s4:所述输入数据经过文本分类模型输出后,判断所述输出数据是否异常。生物组织在发生病变时与正常时的阻抗变化明显,若所述输出数据异常,则说明待检测人体的乳腺部分出现病变,即待检测病人患有乳腺肿瘤;若输出数据正常,则说明待检测人体的乳腺部分生理状况正常,待检测病人没有患乳腺肿瘤。
[0063]
在本技术的进一步实施例中,所述特征提取部分为伪孪生的特征提取网络,所述伪孪生的特征提取网络包括第一分支、第二分支、第一全连接层和第二全连接层,如图2所示,具体步骤如下:
[0064]
s31:将所述输入数据分别输入到第一分支和第二分支进行特征提取,得到第一分支的输出张量和第二分支的输出张量。
[0065]
其中,第一分支是基于transformer结构的特征提取,所述第一分支的特征提取包括:所述输入数据依次通过5个transformer层,再经过1个5
×
5深度可分离卷积,得到所述第一分支的输出张量,通过第一分支的特征提取能够获得输入数据之间更大范围的关联,并减少计算量;所述第二分支是基于全卷积网络的特征提取,所述第二分支包括若干个卷积块,所述卷积块的个数可以根据实际检测的数据个数具体设置,在此不做限定,在此仅以卷积块数量为3个的实施方式进行说明,任一卷积块的处理步骤如下:所述输入数据先进行1个1
×
1卷积,再进行1个3
×
3深度可分离卷积,然后进行1个1
×
1卷积,最后进行神经元随机失活,得到所述第二分支的输出张量。
[0066]
在本技术实施例中,transformer结构中没有规范化子层,而是在多头注意机制子层和前馈全连接层后加上sigmoid激活函数规范张量数据,防止数据过拟合。如图3所示,transformer结构的具体操作包括:
[0067]
s310:将所述输入数据先经过多头注意机制子层,得到第一输出张量,其中多头注意机制的计算规则是:
[0068][0069]
其中q,k,v都是相同的输入数据张量,dk是词嵌入的维度,将q与转置之后的k相乘再对系数进行缩放,然后对缩放后的输入数据张量的最后一个维度进行softmax操作得到注意力张量,最后将softmax操作的输出张量与v相乘得到注意力表示,通过多头注意机制可以得到注意力表示和注意力张量,多头注意机制使输入数据张量进行线性变化,变换矩阵方阵,不改变q,k,v的大小,而多头就是将词嵌入的维度按照头的个数进行了分割,输入到注意力机制,将所述注意力机制输出的张量调整为输入数据张量的大小,所述输入数据经过多头注意机制子层得到第一输出张量;
[0070]
s311:对所述第一输出张量进行线性变化,不改变张量大小,并使用sigmoid激活函数进行激活,得到所述多头注意机制的输出张量,通过sigmoid激活函数进行激活是为了
能够缩小函数范围,防止输入数据过拟合,影响特征提取的结果;
[0071]
s312:将所述多头注意机制的输出张量进行神经元随机失活,得到第二输出张量;
[0072]
s313:将所述第二输出张量与所述输入数据张量进行相加,得到transformer层第一部分的输出张量;
[0073]
s314:将所述transformer层第一部分的输出张量进入前馈全连接层进行处理,并对所述前馈全连接层的输出张量进行随机失活,得到所述transformer层第二部分输出张量;其中,所述前馈全连接层包括第一全连接子层和第二全连接子层,所述前馈全连接层的具体操作如下:
[0074]
将所述transformer层第一部分输出张量进入第一全连接子层进行全连接层操作,并使用relu函数进行激活,将所述transformer层第一部分输出张量中为负数的值都转换为0;
[0075]
将激活后的第一全连接子层输出张量进行神经元随机失活,防止激活后的第一全连接子层输出张量数据过拟合,从而影响特征提取效果;
[0076]
将随机失活后的所述第一全连接子层输出张量再进入第二全连接子层进行全连接层操作,使用sigmoid函数进行激活,得到所述前馈全连接层的输出张量。通过使用sigmoid函数进行激活,将所述随机失活后的第一全连接子层输出张量数据的取值范围限制在(0,1)之间,使第一全连接子层输出张量数据能够更加平滑,以便于对数据进行分类。
[0077]
s315:将所述transformer第一部分输出张量和所述transformer层第二部分输出张量相加,得到transformer层的输出张量。
[0078]
s32:将所述第一分支输出张量和第二分支输出张量合并,得到第三输出张量,对所述第三输出张量进行降维处理,得到第四输出张量。
[0079]
在本技术实施例中,将第一分支的输出张量和第二分支的输出张量逐元素相加得到第三输出张量,此时第三输出张量是四维数据,对所述第三输出张量的维度进行降维,即保持第三输出张量的前两个维度不变,合并后两个维度,得到第四输出张量,所述第四输出张量为三维数据。
[0080]
s33:将所述第四输出张量进行第一全连接层和第二全连接层操作,得到特征提取的输出张量。
[0081]
在本技术实施例中,将第四输出张量输入第一全连接层内进行全连接层操作,并将所述第四输出张量的最后一维缩小为原来的1/4,得到第五输出张量,将所述第五输出张量输入第二全连接层内进行全连接层操作,同时使第五输出张量的最后一维还原回收集人体乳腺部分的电阻率数据的个数,得到第六输出张量,对第六数据张量进行降维处理得到特征提取的输出张量,使所述特征提取的输出张量为二维数据。在本技术一实施方式中,所述降维处理可以是赋值法,将特征提取的输出张量中第一维维度为1的张量直接取出使所述特征提取的输出张量成为二维数据,也可以是通过变形操作将特征提取的输出张量成为二维数据。
[0082]
本技术通过对第一分支的输出张量和第二分支的输出张量进行信息融合以及维度变换,通过伪孪生的特征提取网络对输入数据进行学习,扩大数据之间的差异,使数据的特征明显,以便于类别分类部分对特征提取后的数据进行分类,从而提高对数据的判断准确度。
[0083]
将特征提取的输出张量采用随机森林算法进行类别分类,生成多个类别,并采用投票的方式投出最多票数的类别为最终类别,其中,如图4所示,随机森林算法的具体步骤如下:
[0084]
s341:对特征提取的输出张量进行n次有放回的采样,每次只抽取1个样本,最终形成n个样本,使用选择好的n个样本训练一个决策树,作为决策树根节点出的样本;其中,所述n为收集人体乳腺部分的电阻率数据的个数;
[0085]
s342:每个样本有m个属性,随机在m个属性中抽取m个属性进行分类,对m个属性中的每一个进行分类,使用信息增益对属性做节点的分裂属性,其中m<<m,优选的m=log2m;
[0086]
s343:将所述m个属性按照从小到大的递增顺序进行排列,取相邻两个柱形的中点作为分类点进行二分类,通过信息熵计算公式和最终信息增益计算公式,选出所述m个属性中最终信息增益最大的属性作为最终分裂点,并对所述最终分裂点进行分裂;其中,信息熵计算公式如下:
[0087][0088][0089]
公式中m表示作为分裂属性节点的所有样本同一属性值,avg(mi,mj)表示对进行从小到大排序后相邻的两个属性值求均值,ny表示样本标签y等于相应值时的数量,py表示样本标签y等于相应值时的概率;
[0090]
最终信息增益计算公式如下:
[0091][0092]
公式中d是训练的样本空间,|d|表示训练样本个数,表示训练样本中相应属性值大于分裂属性值的样本个数,表示训练样本中相应属性值小于分裂属性值的样本个数。
[0093]
决策树形成过程中每一个节点都要按照上述方法进行分裂,如果下一次该节点选出的属性在父节点分裂过,则该节点到达叶子节点,无需再分裂,通过建立决策树形成随机森林分类器。
[0094]
s344:针对所述最终分裂点的分裂结果进行预测标记,根据投票法选出得票数最高的标记,并输出此标记结果;若同时有多个标记获得最高票,则从中随机选一个,其中,所述预测标记为0或1,0则表示所述数据集的数据没有出现异常,则说明待检测人体的乳腺部分生理状况正常,待检测病人没有患乳腺肿瘤,1则表示所述数据集的数据出现异常,则说明待检测人体的乳腺部分出现病变,即待检测病人患有乳腺肿瘤。
[0095]
本技术提供一种基于人工智能的乳腺采样数据的处理方法,通过生物电阻抗采集平台采集的电阻率数据识别病人乳腺部分的电阻抗变化,通过伪孪生的特征提取网络对数
据特征进行提取和融合,并利用随机森林算法对特征提取的结果进行分类,判断数据是否异常。通过使用上述实施例的方式制作数据集并对数据进行深度学习和训练,经验证,本技术使用文本分类模型对数据判断的准确率达到90%以上,能够提高乳腺部分在激励源下数据异常的判断,使数据可以作为医生诊断的有效支撑,同时减少病人检测的流程,极大便利了医生和病人,有效提高效率。该文本分类模型不仅可以用于乳腺采样数据的处理,还可衍生到甲状腺、皮肤、直肠、宫颈等其他组织病理的处理。
[0096]
本技术实施例还提供一种电子设备,包括存储器和处理器,所述存储器用于执行所述存储器中存储的文本分类模型,以实现上述任一项所述的一种基于人工智能的乳腺采样数据的处理方法。
[0097]
本技术所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。合适的非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram),它用作外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddr sdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)。
[0098]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0099]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0100]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0101]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0102]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一
致的最宽的范围。

技术特征:


1.一种基于人工智能的乳腺采样数据的处理方法,其特征在于,包括以下步骤:根据待检测病人体外激励频率收集人体乳腺部分的电阻率数据;将所述输入数据输入文本分类模型中,其中所述文本分类模型包括特征提取部分和类别分类部分,所述输入数据依次进行特征提取和类别分类;所述输入数据经过文本分类模型后输出,判断输出数据是否出现异常。2.根据权利要求1所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,所述特征提取部分为伪孪生的特征提取网络,所述伪孪生特征提取网络包括第一分支、第二分支、第一全连接层和第二全连接层,具体步骤如下:将所述输入数据分别输入第一分支和第二分支进行特征提取,得到第一分支的输出张量和第二分支的输出张量;将所述第一分支输出张量和第二分支输出张量合并,得到第三输出张量,对所述第三输出张量进行降维处理,得到第四输出张量;将所述第四输出张量依次进行第一全连接层和第二全连接层操作,得到特征提取的输出张量。3.根据权利要求2所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,所述第一分支是基于transformer结构的特征提取,所述第一分支的特征提取包括:所述输入数据依次通过5个transformer层,再经过1个5
×
5深度可分离卷积,得到所述第一分支的输出张量。4.根据权利要求3所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,所述transformer层的具体操作如下:将所述输入数据先经过多头注意机制子层,得到第一输出张量;将所述第一输出张量进行线性变化,并使用sigmoid激活函数进行激活,得到所述多头注意机制的输出张量;将所述多头注意机制的输出张量进行神经元随机失活,得到第二输出张量;将所述第二输出张量与所述输入数据张量相加,得到transformer层第一部分输出张量;将所述transformer层第一部分输出张量进入前馈全连接层进行处理,并对所述前馈全连接层的输出张量进行神经元随机失活,得到所述transformer层第二部分输出张量;其中前馈全连接层包括第一全连接子层和第二全连接子层;将所述transformer第一部分输出张量和所述transformer层第二部分输出张量相加,得到transformer层的输出张量。5.根据权利要求4所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,将所述transformer层第一部分输出张量进入前馈全连接层进行处理包括:将所述transformer层第一部分输出张量进入第一全连接子层进行全连接层操作,并使用relu函数进行激活;将激活后的第一全连接子层输出张量进行神经元随机失活;将随机失活后的所述第一全连接子层输出张量再进入第二全连接子层进行全连接层操作,使用sigmoid函数进行激活,得到所述前馈全连接层的输出张量。6.根据权利要求2所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,
第二分支是基于全卷机网络的特征提取,所述第二分支包括若干个卷积块,将所述输入张量依次输入所述卷积块中进行处理,得到第二分支的输出张量。7.根据权利要求6所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,所述卷积块的处理步骤如下:将所述输入数据先进行1
×
1卷积,再进行1个3
×
3深度可分离卷积,然后进行1个1
×
1卷积,最后进行神经元随机失活,得到所述第二分支的输出张量。8.根据权利要求1所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,所述类别分类包括将所述特征提取的输出张量采用随机森林分类算法进行类别分类,生成多个类别,并采用投票的方式投出最多票数的类别为最终类别。9.根据权利要求8所述的一种基于人工智能的乳腺采样数据的处理方法,其特征在于,所述随机森林算法的具体步骤如下:对所述特征提取的输出张量进行n次有放回的采样,形成n个样本,所述n为收集人体乳腺部分的电阻率数据的个数;所述每个样本中含有m个属性,随机抽取m个属性进行分类,其中m<<m;将所述m个属性按照从小到大递增排列,通过计算信息熵和最终信息增益,选出所述m个属性中最终信息增益最大的属性作为最终分裂点;对所述最终分裂点进行分裂,并针对所述最终分裂点的分裂结果进行预测标记,根据投票法上选出得票数最高的标记,并输出此标记结果;其中,所述信息熵的计算公式如下:其中,所述信息熵的计算公式如下:公式中m表示作为分裂属性节点的所有样本同一属性值,avg(m
i
,m
j
)表示对进行从小到大排序后相邻的两个属性值求均值,n
y
表示样本标签y等于相应值时的数量,p
y
表示样本标签y等于相应值时的概率;所述最终信息增益的计算公式如下:公式中d是训练的样本空间,|d|表示训练样本个数,表示训练样本中相应属性值大于分裂属性值的样本个数,表示训练样本中相应属性值小于分裂属性值的样本个数。10.一种电子设备,其特征在于,包括存储器和处理器,所述处理器用于执行所述存储器中存储的文本分类模型,以实现权利要求1-9中任意一项所述的一种基于人工智能的乳腺采样数据的处理方法。

技术总结


本申请公开了一种基于人工智能的乳腺采样数据的处理方法,包括以下步骤:根据待检测病人体外激励频率收集人体乳腺部分的电阻率数据;对所述电阻率数据进行处理,得到对应的四维输入数据;将所述输入数据输入文本分类模型中,其中所述文本分类模型包括特征提取部分和类别分类部分,所述输入数据依次进行特征提取和类别分类;所述输入数据经过文本分类模型后输出,判断输出数据是否出现异常。本申请的文本分类模型能够对输入数据进行学习和处理以获得数据之间更多的关联信息,并对处理后的数据进行分类,判断数据是否出现异常,从而减少病人检测流程,有效提高判断的准确度,为医生的判断提供数据支撑,极大便利了医生和病人。人。人。


技术研发人员:

胡钦勇 燕自保 袁静萍

受保护的技术使用者:

武汉中数医疗科技有限公司

技术研发日:

2022.09.09

技术公布日:

2022/12/16

本文发布于:2024-09-23 21:25:54,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/43605.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:张量   所述   数据   特征
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议