基于深度学习模型的药品风险识别方法、装置及终端设备与流程



1.本技术属于神经网络模型技术领域,尤其涉及一种基于深度学习模型的药品风险识别方法、装置及终端设备。


背景技术:



2.在针对药品的使用情况、潜在获益以及风险的相关研究过程中,需要基于健康医学大数据采集大量的真实世界数据(来源于各种与患者健康状况和/或诊疗及保健有关的数据),例如医院信息系统数据、医保支付数据、疾病登记数据、公共卫生监测数据(如药品安全性监测、死亡信息登记、院外健康监测)、自然人队列数据,来自移动设备的个体健康监测数据等等,然而,由于真实世界的数据来源广泛,数量庞大,相关的药品风险识别方法的识别效率较低且准确性不高,影响药品风险研究效率。


技术实现要素:



3.本技术实施例提供了一种基于深度学习模型的药品风险识别方法及装置,可以解决相关的药品风险识别方法的效率较低且准确性不高的问题。
4.第一方面,本技术实施例提供了一种基于深度学习模型的药品风险识别方法,包括:
5.获取待处理药品真实世界数据;
6.将所述待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,得到变量关系;
7.确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称;
8.将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型。
9.在一个实施例中,所述获取待处理药品真实世界数据之前,包括:
10.获取多个原始训练数据;
11.对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
12.在一个实施例中,所述关键变量关系提取模型由序列标注模型和运用季节自回归移动平均模型顺次连接构成;
13.所述对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型,包括:
14.通过预设数据处理方法对所述原始训练数据进行预处理,得到预处理后的原始训练数据;其中,所述预设数据处理方法包括去标志化处理、去重处理中的至少一种;
15.在检测到所述预处理后的原始训练数据为结构化数据时,基于所述预处理后的原始训练数据构建训练数据集;
16.在检测到所述预处理后的原始训练数据为非结构化数据时,为所述预处理后的原始训练数据添加对应的变量标签,基于携带变量标签的预处理后的原始训练数据构建训练数据集;
17.将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
18.在一个实施例中,所述确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称,包括:
19.确定符合预设条件的目标变量关系;
20.确定与所述目标变量关系对应的目标变量,通过预设编码转换方法对所述目标变量进行编码转换,得到与所述目标变量对应的不良反应名称;其中,所述预设编码转换方法包括meddra编码转换方法、whoart编码转换方法、who-dd编码转换方法或者icd-10编码转换方法。
21.在一个实施例中,所述将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型,包括:
22.将所述不良反应名称与预存储不良反应名称进行匹配;
23.在检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为已识别风险。
24.在一个实施例中,所述将所述不良反应名称与预存储不良反应名称进行匹配之后,还包括:
25.未检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为潜在风险。
26.第二方面,本技术实施例提供了一种基于深度学习模型的药品风险识别装置,包括:
27.原始数据获取模块,用于获取待处理药品真实世界数据;
28.模型处理模块,用于将所述待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,得到变量关系;
29.不良反应确定模块,用于确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称;
30.风险类型确定模块,用于将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型。
31.在一个实施例中,所述装置,还包括:
32.训练数据获取模块,用于获取多个原始训练数据;
33.预训练模块,用于对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
34.在一个实施例中,所述关键变量关系提取模型由序列标注模型和运用季节自回归移动平均模型顺次连接构成;
35.在一个实施例中,所述预训练模块,包括:
36.预处理单元,用于通过预设数据处理方法对所述原始训练数据进行预处理,得到预处理后的原始训练数据;其中,所述预设数据处理方法包括去标志化处理、去重处理中的至少一种;
37.第一训练集构建单元,用于在检测到所述预处理后的原始训练数据为结构化数据时,基于所述预处理后的原始训练数据构建训练数据集;
38.第二训练集构建单元,用于在检测到所述预处理后的原始训练数据为非结构化数据时,为所述预处理后的原始训练数据添加对应的变量标签,基于携带变量标签的预处理后的原始训练数据构建训练数据集;
39.预训练单元,用于将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
40.在一个实施例中,所述不良反应确定模块,包括:
41.类别确定单元,用于确定符合预设条件的目标变量关系;
42.变量转换单元,用于确定与所述目标变量关系对应的目标变量,通过预设编码转换方法对所述目标变量进行编码转换,得到与所述目标变量对应的不良反应名称;其中,所述预设编码转换方法包括meddra编码转换方法、whoart编码转换方法、who-dd编码转换方法或者icd-10编码转换方法。
43.在一个实施例中,所述风险类型确定模块,包括:
44.匹配单元,用于将所述不良反应名称与预存储不良反应名称进行匹配;
45.第一风险识别单元,用于在检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为已识别风险。
46.在一个实施例中,所述不良反应确定模块,还包括:
47.第二风险识别单元,用于未检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为潜在风险。
48.第三方面,本技术实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面任一项所述的基于深度学习模型的药品风险识别方法。
49.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一项所述的基于深度学习模型的药品风险识别方法。
50.第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的基于深度学习模型的药品风险识别方法。
51.本技术实施例与现有技术相比存在的有益效果是:通过预训练的关键变量关系提取模型对待处理药品真实世界数据识别得到变量关系,并根据与目标变量关系对应的目标变量确定对应的不良反应名称,将不良反应名称与预存储不良反应名称进行匹配,从而确定待处理药品真实世界数据的风险类型,实现基于神经网络模型准确识别出药品数据的变量关系,从而基于关键变量关系得到对应的待处理药品真实世界数据的风险类型,提高药品风险识别的效率和精度,进而提高风险与药品相关性判定的准确性和可信度。
52.可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
53.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
54.图1是本技术实施例提供的基于深度学习模型的药品风险识别方法的流程示意图;
55.图2是本技术实施例提供的基于深度学习模型的药品风险识别方法的另一流程示意图;
56.图3是本技术实施例提供的基于深度学习模型的药品风险识别方法步骤s202的流程示意图;
57.图4是本技术实施例提供的基于深度学习模型的药品风险识别装置的结构示意图;
58.图5是本技术实施例提供的终端设备的结构示意图。
具体实施方式
59.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
60.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
61.还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
62.如在本技术说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0063]
另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0064]
在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变
形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0065]
本技术实施例提供的基于深度学习模型的药品风险识别方法可以应用于手机、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,umpc)等终端设备上,本技术实施例对终端设备的具体类型不作任何限制。
[0066]
图1示出了本技术提供的基于深度学习模型的药品风险识别方法的示意性流程图,作为示例而非限定,该方法可以应用于上述笔记本电脑中。
[0067]
s101、获取待处理药品真实世界数据。
[0068]
具体地,通过需要进行风险识别的待处理药品的相关数据作为待处理药品真实世界数据。真实世界研究(real world study,rws;real world research,rwr),即在真实世界环境下收集与患者有关的数据(real world data,rwd,也即真实世界数据),通过分析获得医疗产品的使用价值及潜在获益或风险的临床证据(rwe),主要研究类型是观察性研究,也可以是临床试验。真实世界数据包括但不限于基于医院信息系统(hospital information system,his)获取到的his数据,该药品的相关医保报销数据,与该药品相关的随身携带设备数据(例如,哮喘药品相关的气雾剂数据等)。
[0069]
可以理解的是,上述待处理药品真实世界数据可以是结构化数据或非结构化数据。其中,结构化数据为具有高度组织和整齐格式化的数据。非结构化数据为结构化数据以外的数据。
[0070]
s102、将所述待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,得到变量关系。
[0071]
具体地,将上述待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,使得预训练的关键变量关系提取模型识别出该待处理药品真实世界数据中的变量,并基于上述变量确定对应的变量关系。其中,变量为药品的属性数据,包括但不限于疾病(具体指某种疾病的名称),检查(具体指针对该种疾病的相关医疗检查项目及对应的检查数据),(具体指针对该种疾病进行的相关药品方法及手段),药品(具体指针对该种疾病进行时用户所使用到的药品名称),症状/诊断(具体指该种疾病的诊断依据、用户生命体征数据及身体状态表征),结局(具体指通过一定的方法、药品后用户的生命体征数据及身体状态表征)。变量关系用于表示两个变量之间的因果关系,包括但不限于trws(恶化了症状),trwd(恶化了疾病),trnas(因为症状而没有采取),trnad(因为疾病而没有采取),trcs(导致了症状),trcd(导致了疾病),tris(改善了症状),trid(改善了疾病),tras(施加于症状),trad(施加于疾病),ters(检查证实了症状),terd(检查证实了疾病),tecd(为了证实疾病而采取检查),teas(因为症状而采集),sid(症状表明了疾病),dcs(疾病导致了症状)。
[0072]
s103、确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称。
[0073]
具体地,基于不同因果关系对药品风险识别的影响程度不同,需要从多个药品变量之间的变量关系中选择对药品风险识别影响最为重要的一个或多个变量关系作为目标变量关系,并确定与输出的目标变量关系对应的目标变量,通过对目标变量进行处理确定与待处理药品对应的不良反应名称。
[0074]
例如,设定目标变量关系包括trws(恶化了症状),trwd(恶化了疾病),
trcs(导致了症状),trcd(导致了疾病)。
[0075]
s104、将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型。
[0076]
具体地,在检测到待处理药品的药品说明书等相关资料中包含相关的一个或多个不良反应数据时,将上述不良反应数据转换成不良反应名称并进行预存储,得到预存储不良反应名称。
[0077]
具体地,将与目标变量相关的不良反应名称与预存储不良反应名称进行匹配,得到对应的匹配结果(匹配结果包括不良反应名称与某个预存储不良反应名称相同的第一匹配结果,或者不良反应名称与所有预存储不良反应名称均不相同的第二匹配结果),根据不良反应名称与预存储不良反应名称的匹配结果确定待处理药品真实世界数据的风险类型。
[0078]
如图2所示,在一个实施例中,所述获取待处理药品真实世界数据之前,包括:
[0079]
s201、获取多个原始训练数据;
[0080]
s202、对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
[0081]
具体地,通过经授权的相关医疗信息数据库获取多个原始训练数据,对原始训练数据进行预处理,筛选掉不易识别变量的、重复性的数据,得到预处理后的原始训练数据,基于与处理后的原始训练数据构建得到训练数据集,并将训练数据集输入至关键变量关系提取模型中进行预训练,得到预训练的关键变量关系提取模型。
[0082]
在一个实施例中,所述关键变量关系提取模型由序列标注模型和运用季节自回归移动平均模型顺次连接构成。
[0083]
具体地,关键变量关系提取模型由序列标注模型(bidirectional lstm networks conditional random field,bi-lstm-crf)和运用季节自回归移动平均模型(autoregressive integrated moving average model,arima)顺次连接构成。其中,序列标注(bi-lstm-crf)模型包括输入特征层、bi-lstm中间层、crf输出层;其中,输入特征层通过stanford parser工具对非结构化数据进行分词,根据医疗领域的实体特点来定义特征,并构造特征向量,得到实体的特征向量作为输入特征数据,输入至bi-lstm中间层;bi-lstm中间层用于利用双向lstm循环神经网络对输入的序列信息进行上下文特征提取,将两个方向的lstm特征结果进行拼接,并将拼接结果输入crf输出层;crf输出层用于输出不同的变量标签,即非结构化数据的序列标注结果(其中,结构化数据可基于其构成的语义关系网络进行自动标注)。根据变量标签携带的序列标注的结果能够确定与上述变量标签对应的变量关系。arima模型对序列标注(bi-lstm-crf)模型的识别结果进行修正,以提高变量关系的分类精度,得到预训练后的关键变量关系提取模型。
[0084]
如图3所示,在一个实施例中,所述对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型的步骤s202,包括:
[0085]
s2021、通过预设数据处理方法对所述原始训练数据进行预处理,得到预处理后的原始训练数据;其中,所述预设数据处理方法包括去标志化处理、去重处理中的至少一种;
[0086]
s2022、在检测到所述预处理后的原始训练数据为结构化数据时,基于所述预处理
后的原始训练数据构建训练数据集;
[0087]
s2023、在检测到所述预处理后的原始训练数据为非结构化数据时,为所述预处理后的原始训练数据添加对应的变量标签,基于携带变量标签的预处理后的原始训练数据构建训练数据集;
[0088]
s2024、将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
[0089]
具体地,通过预设数据处理方法(预设数据处理方法包括但不限于去标志化处理、去重处理中的至少一种)对原始训练数据集进行预处理,得到能够便于识别变量的非重复性的预处理后的原始训练数据。在检测到预处理后的原始训练数据为结构化数据时,由于结构化数据能够基于其构成的语义关系网络识别得到对应的变量,因此能够直接基于预处理后的原始训练数据构建训练数据集。在检测到预处理后的原始训练数据为非结构化数据时,由于非结构化数据的特性(没有高度组织和整齐格式化导致较难识别得到对应的变量)需要针对预处理后的原始训练数据添加对应的变量标签,并基于携带变量标签的预处理后的原始训练数据构建训练数据集。将训练数据集输入至关键变量关系提取模型中进行预训练,得到预训练的关键变量关系提取模型。
[0090]
具体地,去标志化处理是指将待处理药品真实世界数据中的患者姓名、患者家庭住址等隐私信息用可区别的有序的数字替代,将其身份信息隐匿化处理。去重处理是指将数据库中同一病例号的信息重复项进行剔除,包括:利用布隆过滤器bloom filter对数据进行过滤、去除重复数据;首先对数据利用n个hash函数映射到位数组中,计算n个hash值,如果计算出的hash值存在于位数组中,则说明该数据已经存在,将其过滤掉。
[0091]
在一个实施例中,所述确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称,包括:
[0092]
确定符合预设条件的目标变量关系;
[0093]
确定与所述目标变量关系对应的目标变量,通过预设编码转换方法对所述目标变量进行编码转换,得到与所述目标变量对应的不良反应名称;其中,所述预设编码转换方法包括meddra编码转换方法、whoart编码转换方法、who-dd编码转换方法或者icd-10编码转换方法。
[0094]
具体地,设定预设条件为与疾病、症状变量之间的影响为负面影响的变量关系(例如,包括trws(恶化了症状),trwd(恶化了疾病),trcs(导致了症状),trcd(导致了疾病)),对应的需要从预训练的关键变量关系提取模型输出的变量关系中筛选出满足上述预设条件的目标变量关系,确定与上述目标变量关系对应的目标变量,将上述目标变量通过预设编码方法进行编码转换,得到与目标变量对应的不良反应名称;其中预设编码转换方法包括但不限于meddra编码转换方法、whoart编码转换方法、who-dd编码转换方法或者icd-10编码转换方法。meddra是在ich主办下创建的国际医学术语集。meddra用于医疗产品整个研发与应用周期的行政管理,对医学信息进行分类、检索、报告与信息交流。meddra具体为新药注册用医学词典,适用于政府注册管辖下所有的医疗和诊断产品的安全报告。在新药注册环节中需要用到meddra的有临床研究、不良反应的自发性报告、注册报告、受政府注册管理的产品信息。meddra用于药品上市后不良反应监测中,用于药品不良反应的报告和数据分析等。meddra编码转换方法即为基于meddra词典实现的不良
反应编码转换方法。
[0095]
whoart具体是一个精确度较高的用于编码与药物过程中的临床信息的术语集,主要在参加who药品监测项目的成员国中免费使用,世界上的制药企业和临床研究机构也在使用。whoart术语集自开发30多年以来一直是不良反应术语合理编码的基础。whoart涵盖了几乎所有的在不良反应报告中所需的医学术语,但仍小而精干,可以以行列表的形式打印出来。由于新药和新的适应证会产生新的不良反应术语,术语集的结构是灵活可变的,允许在保留术语集结构的基础上纳入新的术语,同时又可以不丢失之前术语间的关系。whoart编码转换方法即为基whoart术语集实现的不良反应编码转换方法。
[0096]
who-dd具体为世界卫生组织药物词典(who drug dictionary)。who-dd编码转换方法即为基于who-dd词典实现的不良反应编码转换方法。
[0097]
the international statistical classification of diseases and related health problems 10th revision(icd-10),即国际疾病伤害及死因分类标准第十版,是世界卫生组织(who)依据疾病的某些特征,按照规则将疾病分门别类,并用编码的方法来表示的系统。icd-10编码转换方法即为基于icd-10词典实现的不良反应编码转换方法。
[0098]
例如,a疾病的药品名称为a,a药品携带有变量a1,疾病变量a2,在检测到a药品的变量关系为trcd时,通过meddra编码转换方法对a1、a2进行转换,得到与目标变量对应的不良反应名称(例如,不良反应名称为通过手段a1:服用药品a,可能会导致用户出现a2疾病)。
[0099]
在一个实施例中,所述将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型,包括:
[0100]
将所述不良反应名称与预存储不良反应名称进行匹配;
[0101]
在检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为已识别风险。
[0102]
具体地,将基于编码转换得到的待处理药品的不良反应名称与待处理药品的预存储的不良反应名称进行匹配,在检测到某个预存储不良反应名称与上述待处理药品的不良反应名称相同时,判定存在与不良反应名称匹配的预存储不良反应名称,确定该待处理药品真实世界数据存在的风险类型为已识别风险,即该待处理药品不存在其它风险。对应的,生成第一风险告警通知,上述第一风险告警通知包括待处理药品真实世界数据存在的风险类型为已识别风险,以及对应的不良反应名称。
[0103]
在一个实施例中,所述将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型,还包括:
[0104]
未检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为潜在风险。
[0105]
具体地,在检测到任一个预存储不良反应名称均与上述不良反应名称不相同时,判定不良反应名称与预存储不良反应名称不匹配,确定待处理药品真实世界数据存在的风险类型为潜在风险。对应的,生成第二风险告警通知,上述第二风险告警通知包括待处理药品真实世界数据存在的风险类型为潜在风险,以及上述未匹配到预存储不良反应名称的不良反应名称。
[0106]
通过神经网络模型对待处理药品的风险类型进行识别,将得到的识别结果作为制
定药品风险管理计划的基础和药品获益风险考量的重要依据,从而提高了药品风险识别的效率和精度,以及针对医疗产品有效性和安全性评价的检验效率。
[0107]
在一个实施例中,在检测到某待处理药品包含至少两个不良反应名称时,需要分别针对每个不良反应名称进行与预存储的不良反应名称的匹配操作,在检测到任一个不良反应名称未匹配到对应的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为潜在风险。
[0108]
本实施例通过预训练的关键变量关系提取模型对待处理药品真实世界数据识别得到变量关系,并根据与目标变量关系对应的目标变量确定对应的不良反应名称,将不良反应名称与预存储不良反应名称进行匹配,从而确定待处理药品真实世界数据的风险类型,实现基于神经网络模型准确识别出药品数据的变量关系,从而基于关键变量关系得到对应的待处理药品真实世界数据的风险类型,提高药品风险识别的效率和精度,进而提高风险与药品相关性判定的准确性和可信度。
[0109]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0110]
对应于上文实施例所述的基于深度学习模型的药品风险识别方法,图4示出了本技术实施例提供的基于深度学习模型的药品风险识别装置的结构框图,为了便于说明,仅示出了与本技术实施例相关的部分。
[0111]
参照图4,该基于深度学习模型的药品风险识别装置100包括:
[0112]
原始数据获取模块101,用于获取待处理药品真实世界数据;
[0113]
模型处理模块102,用于将所述待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,得到变量关系;
[0114]
不良反应确定模块103,用于确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称;
[0115]
风险类型确定模块104,用于将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型。
[0116]
在一个实施例中,所述装置,还包括:
[0117]
训练数据获取模块,用于获取多个原始训练数据;
[0118]
预训练模块,用于对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
[0119]
在一个实施例中,所述关键变量关系提取模型由序列标注模型和运用季节自回归移动平均模型顺次连接构成;
[0120]
在一个实施例中,所述预训练模块,包括:
[0121]
预处理单元用于,通过预设数据处理方法对所述原始训练数据进行预处理,得到预处理后的原始训练数据;其中,所述预设数据处理方法包括去标志化处理、去重处理中的至少一种;
[0122]
第一训练集构建单元,用于在检测到所述预处理后的原始训练数据为结构化数据时,基于所述预处理后的原始训练数据构建训练数据集;
[0123]
第二训练集构建单元,用于在检测到所述预处理后的原始训练数据为非结构化数据时,为所述预处理后的原始训练数据添加对应的变量标签,基于携带变量标签的预处理后的原始训练数据构建训练数据集;
[0124]
预训练单元,用于将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。
[0125]
在一个实施例中,所述不良反应确定模块,包括:
[0126]
类别确定单元,用于确定符合预设条件的目标变量关系;
[0127]
变量转换单元,用于确定与所述目标变量关系对应的目标变量,通过预设编码转换方法对所述目标变量进行编码转换,得到与所述目标变量对应的不良反应名称;其中,所述预设编码转换方法包括meddra编码转换方法、whoart编码转换方法、who-dd编码转换方法或者icd-10编码转换方法。
[0128]
在一个实施例中,所述风险类型确定模块,包括:
[0129]
匹配单元,用于将所述不良反应名称与预存储不良反应名称进行匹配;
[0130]
第一风险识别单元,用于在检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为已识别风险。
[0131]
在一个实施例中,所述不良反应确定模块,还包括:
[0132]
第二风险识别单元,用于未检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为潜在风险。
[0133]
本实施例通过预训练的关键变量关系提取模型对待处理药品真实世界数据识别得到变量关系,并根据与目标变量关系对应的目标变量确定对应的不良反应名称,将不良反应名称与预存储不良反应名称进行匹配,从而确定待处理药品真实世界数据的风险类型,实现基于神经网络模型准确识别出药品数据的变量关系,从而基于关键变量关系得到对应的待处理药品真实世界数据的风险类型,提高药品风险识别的效率和精度,进而提高风险与药品相关性判定的准确性和可信度。
[0134]
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0135]
图5为本实施例提供的终端设备的结构示意图。如图5所示,该实施例的终端设备5包括:至少一个处理器50(图5中仅示出一个)处理器、存储器51以及存储在所述存储器51中并可在所述至少一个处理器50上运行的计算机程序52,所述处理器50执行所述计算机程序52时实现上述任意各个基于深度学习模型的药品风险识别方法实施例中的步骤。
[0136]
所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的举例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
[0137]
所称处理器50可以是中央处理单元(central processing unit,cpu),该处理器50还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、
分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0138]
所述存储器51在一些实施例中可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51在另一些实施例中也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储操作系统、应用程序、引导装载程序(bootloader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
[0139]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0140]
本技术实施例还提供了一种网络设备,该网络设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
[0141]
本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
[0142]
本技术实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
[0143]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
[0144]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0145]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单
元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0146]
在本技术所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0147]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0148]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。

技术特征:


1.一种基于深度学习模型的药品风险识别方法,其特征在于,包括:获取待处理药品真实世界数据;将所述待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,得到变量关系;确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称;将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型。2.如权利要求1所述的基于深度学习模型的药品风险识别方法,其特征在于,所述获取待处理药品真实世界数据之前,包括:获取多个原始训练数据;对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。3.如权利要求2所述的基于深度学习模型的药品风险识别方法,其特征在于,所述关键变量关系提取模型由序列标注模型和运用季节自回归移动平均模型顺次连接构成;所述对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型,包括:通过预设数据处理方法对所述原始训练数据进行预处理,得到预处理后的原始训练数据;其中,所述预设数据处理方法包括去标志化处理、去重处理中的至少一种;在检测到所述预处理后的原始训练数据为结构化数据时,基于所述预处理后的原始训练数据构建训练数据集;在检测到所述预处理后的原始训练数据为非结构化数据时,为所述预处理后的原始训练数据添加对应的变量标签,基于携带变量标签的预处理后的原始训练数据构建训练数据集;将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。4.如权利要求1所述的基于深度学习模型的药品风险识别方法,其特征在于,所述确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称,包括:确定符合预设条件的目标变量关系;确定与所述目标变量关系对应的目标变量,通过预设编码转换方法对所述目标变量进行编码转换,得到与所述目标变量对应的不良反应名称;其中,所述预设编码转换方法包括meddra编码转换方法、whoart编码转换方法、who-dd编码转换方法或者icd-10编码转换方法。5.如权利要求1所述的基于深度学习模型的药品风险识别方法,其特征在于,所述将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型,包括:将所述不良反应名称与预存储不良反应名称进行匹配;在检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真
实世界数据存在的风险类型为已识别风险。6.如权利要求1至5任一项所述的基于深度学习模型的药品风险识别方法,其特征在于,所述将所述不良反应名称与预存储不良反应名称进行匹配之后,还包括:未检测到与所述不良反应名称匹配的预存储不良反应名称时,确定所述待处理药品真实世界数据存在的风险类型为潜在风险。7.一种基于深度学习模型的药品风险识别装置,其特征在于,包括:原始数据获取模块,用于获取待处理药品真实世界数据;模型处理模块,用于将所述待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,得到变量关系;不良反应确定模块,用于确定与目标变量关系对应的目标变量,根据所述目标变量确定对应的不良反应名称;风险类型确定模块,用于将所述不良反应名称与预存储不良反应名称进行匹配,基于所述匹配结果,确定所述待处理药品真实世界数据的风险类型。8.如权利要求7所述的基于深度学习模型的药品风险识别装置,其特征在于,所述装置,还包括:训练数据获取模块,用于获取多个原始训练数据;预训练模块,用于对所述原始训练数据进行预处理,基于预处理后的原始训练数据构建训练数据集,并将所述训练数据集输入至关键变量关系提取模型中进行预训练,得到所述预训练的关键变量关系提取模型。9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。

技术总结


本申请适用于神经网络模型技术领域,提供了一种基于深度学习模型的药品风险识别方法、装置及终端设备,方法包括:获取待处理药品真实世界数据,将待处理药品真实世界数据输入至预训练的关键变量关系提取模型中进行处理,得到变量关系,确定与目标变量关系对应的目标变量,根据目标变量确定对应的不良反应名称,将不良反应名称与预存储不良反应名称进行匹配,基于匹配结果,确定待处理药品真实世界数据的风险类型。本申请基于预训练的关键变量关系提取模型准确识别出药品真实世界数据的变量关系,从而基于关键变量关系得到待处理药品真实世界数据的风险类型,提高药品风险识别的效率和精度,提高风险与药品相关性判定的准确性和可信度。可信度。可信度。


技术研发人员:

王登 郑园园 肖博文 谭敏慧 首智慧

受保护的技术使用者:

长沙砝码柯数据科技有限责任公司

技术研发日:

2022.11.22

技术公布日:

2023/3/10

本文发布于:2024-09-22 21:16:16,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/69585.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:所述   变量   数据   不良反应
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议