一种基于战略领域信息文本的标签体系构建方法与流程



1.本发明涉及标签体系构建技术领域,具体为一种基于战略领域信息文本的标签体系构建方法。


背景技术:



2.战略信息管理是一个比较新且非常重要的研究领域,文章主要研究了战略信息管理产生的背景、形成和发展,分析了战略管理的相关概念并且在此基础上,从对战略信息管理的概念以及从战略规划的角度考察,战略信息管理可以视之为信息战略的展开过程,是企业信息功能战略的制订、实施、监控、调整及其与企业业务战略的整合过程,从理论来源的角度考察,战略信息管理可以视作战略管理与信息管理的交集,是一种跨领域的管理活动;从领域分析的角度考察,战略信息管理可以视之为一个跨越所有企业活动领域的相对独立的功能领域,是围绕信息、信息技术、信息人员、信息设备及其它相关资源实施规划、预算、组织、指挥、控制、协调和培训等活动的多功能领域。
3.战略信息管理主要是沿着两个方向成长的:沿着技术方向,经由数据处理、管理信息系统、战略信息系统、it战略管理,而最终实现了与业务战略的整合,形成了战略信息管理;沿着信息资源方向,经由文献管理、科技情报管理、竞争情报分析、战略规划,而最终依托战略信息系统,开创了战略信息管理的新领域,当企业信息功能领域的两大主流沿着不同的方向到达战略信息管理的高度时,信息技术与信息资源已自成一体,需要做的只是通过信息体制使这种自成一体的新的信息功能体制度化和组织化,以最大限度地发挥信息功能的作用。
4.在大数据的浪潮下,人们每天接触到的数据信息呈指数增长,标签作为对某种信息主体的高度刻画,可以将人们从大量冗余信息中解放出来,庞大的数据量使得人工归纳标签成本过高、难度过大,且主观偏见也将影响标签识别的准确性,目前标签构建体系通常为垂直检索,由于这些文本数据往往具有多种信息源,具有不同的特点和特征,从不同的角度解读着标签信息,现有技术中对于融合多类型信息效果不明显、分类效果较差以及对于有效特征的提取不准确,对不同的信息源有的融合过于简单,无法将两种文本信息源的特征、标签相关信息进行有机融合,从而无法实现高效的多标签分类。


技术实现要素:



5.本发明的目的就在于为了解决上述问题而提供一种基于战略领域信息文本的标签体系构建方法,解决了背景技术中提到的问题。
6.为了解决上述问题,本发明提供了一种技术方案:
7.一种基于战略领域信息文本的标签体系构建方法,包括以下步骤:
8.s1、获取预设战略信息文本,对信息文本中的词频和图片进行读取,然后将图文记录在数据库中;
9.s2、对读取的图文信息进行初步分类,然后选择对应的候选标签,对归类后的图文
信息进行初级标签标识;
10.s3、对获得初级标签的图文信息料进行标记处理,同时对图文信息进行特征向量提取,并将提取的特征向量与数据库中的信息进行匹配,然后对图文信息的标签进行细分标记;
11.s4、对各细分标签后的信息进行相似度对比,并将相似度高于设定值的标签信息进行合并,组合成完整的信息标签体系;
12.s5、选取完整标签体系中的一个或多个标签作为检测对象,并将标签内容与信息文本中的原始数据进行对比验证。
13.作为优选,所述步骤s2中的初步分类包括以下步骤:
14.s201、根据图文信息提取关键图词信息集,所述关键图词信息集包括至少一个关键词信息;
15.s202、根据所述关键词信息对比数据库中的原始信息,匹配所述关键词信息对应的类别信息;
16.s203、根据匹配出的类别信息对待分类信息进行分类。
17.作为优选,所述步骤s3中对图文信息进行特征向量进行提取时,对未能识别的图文信息进行特征向量标记,同时将带有标记的特征向量信息与匹配后的图文信息进行相似度比对,并对未能识别的图文信息根据相似度进行穿插。
18.作为优选,所述步骤s4中的信息相似度对比包括以下步骤:
19.s401、获取细分后的标签内容,并对标签内容进行图文特征提取;
20.s402、对获取文本信息特征并进行逐一比对。
21.作为优选,所述步骤s3中对标签进行细分标记时,可以根据关键字信息对标签进行不同层级分类。
22.作为优选,所述层级的分类包括以下步骤:
23.a1、建立统计对象的多维多层级分类,并使用分类系统对信息对象进行标注统计;
24.a2、对所述标注统计信息聚类并关联数据库中的标签体系,得到多层级关键词列表;
25.a3、参照数据库中的原始信息,对所述多层级关键词列表进行匹配,最终根据关键词得到各层级的信息标签。
26.作为优选,所述步骤s5中的对比验证包括以下步骤:
27.b1、逐条选择系统体系中的标签,并获取当前标签对应层级标签的全部内容信息;
28.b2、从数据库中调取对信息文本读取的词频和图片,从词频和图片中查与标签内容相关的信息,并对标签内容信息和数据库中的内容信息进行全面比对。
29.本发明的有益效果是:可以根据文本内容进行自动提取分类,同时可以对不能识别的信息进行相似度对比穿插,从而提高了对文本内容的保留,而且可以对标签信息进行不同层级的分类,还可以标签内容的相似度进行合并,有利于提高标签对象描述的准确性,构建后的标签体系可以进行进行复查,不仅完善了体系的步骤,而且不需要人工干预。
附图说明:
30.为了易于说明,本发明由下述的具体实施及附图作以详细描述。
31.图1是本发明工作流程示意图。
具体实施方式:
32.如图1所示,本具体实施方式采用以下技术方案:
33.实施例:
34.一种基于战略领域信息文本的标签体系构建方法,包括以下步骤:
35.s1、获取预设战略信息文本,对信息文本中的词频和图片进行读取,然后将图文记录在数据库中;
36.s2、对读取的图文信息进行初步分类,然后选择对应的候选标签,对归类后的图文信息进行初级标签标识;
37.s3、对获得初级标签的图文信息料进行标记处理,同时对图文信息进行特征向量提取,并将提取的特征向量与数据库中的信息进行匹配,然后对图文信息的标签进行细分标记;
38.s4、对各细分标签后的信息进行相似度对比,并将相似度高于设定值的标签信息进行合并,组合成完整的信息标签体系;
39.s5、选取完整标签体系中的一个或多个标签作为检测对象,并将标签内容与信息文本中的原始数据进行对比验证。
40.其中,所述步骤s2中的初步分类包括以下步骤:
41.s201、根据图文信息提取关键图词信息集,所述关键图词信息集包括至少一个关键词信息;
42.s202、根据所述关键词信息对比数据库中的原始信息,匹配所述关键词信息对应的类别信息;
43.s203、根据匹配出的类别信息对待分类信息进行分类。
44.其中,所述步骤s3中对图文信息进行特征向量进行提取时,对未能识别的图文信息进行特征向量标记,同时将带有标记的特征向量信息与匹配后的图文信息进行相似度比对,并对未能识别的图文信息根据相似度进行穿插。
45.其中,所述步骤s4中的信息相似度对比包括以下步骤:
46.s401、获取细分后的标签内容,并对标签内容进行图文特征提取;
47.s402、对获取文本信息特征并进行逐一比对。
48.其中,所述步骤s3中对标签进行细分标记时,可以根据关键字信息对标签进行不同层级分类。
49.其中,所述层级的分类包括以下步骤:
50.a1、建立统计对象的多维多层级分类,并使用分类系统对信息对象进行标注统计;
51.a2、对所述标注统计信息聚类并关联数据库中的标签体系,得到多层级关键词列表;
52.a3、参照数据库中的原始信息,对所述多层级关键词列表进行匹配,最终根据关键词得到各层级的信息标签。
53.其中,所述步骤s5中的对比验证包括以下步骤:
54.b1、逐条选择系统体系中的标签,并获取当前标签对应层级标签的全部内容信息;
55.b2、从数据库中调取对信息文本读取的词频和图片,从词频和图片中查与标签内容相关的信息,并对标签内容信息和数据库中的内容信息进行全面比对。
56.具体的,当需要对战略信息文本的内容进行标签分类时,将预设战略信息文本导入到系统内部,此时系统对信息文本中的词频和图片进行读取,并将图文记录到数据库中,根据图文信息提取关键图词信息集,根据关键词信息对比数据库中的原始信息,匹配所述关键词信息对应的类别信息,根据匹配出的类别信息对待分类信息进行分类,然后选择对应的候选标签,对归类后的图文信息进行初级标签标识,对获得初级标签的图文信息料进行标记处理,同时对图文信息进行特征向量提取,且对未能识别的图文信息进行特征向量标记,并将提取的特征向量与数据库中的信息进行匹配,同时将带有标记的特征向量信息与匹配后的图文信息进行相似度比对,并对未能识别的图文信息根据相似度进行穿插,根据关键字信息对标签进行不同层级分类,然后对图文信息的标签进行细分标记,然后获取细分后的标签内容,并对标签内容进行图文特征提取,对获取文本信息特征并进行逐一比对,将相似度高于设定值的标签信息进行合并,组合成完整的信息标签体系,在对标签体系进行验证时,逐条选择系统体系中的标签,并获取当前标签对应层级标签的全部内容信息,然后从数据库中调取对信息文本读取的词频和图片,从词频和图片中查与标签内容相关的信息,并对标签内容信息和数据库中的内容信息进行全面比对。
57.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:


1.一种基于战略领域信息文本的标签体系构建方法,其特征在于,包括以下步骤:s1、获取预设战略信息文本,对信息文本中的词频和图片进行读取,然后将图文记录在数据库中;s2、对读取的图文信息进行初步分类,然后选择对应的候选标签,对归类后的图文信息进行初级标签标识;s3、对获得初级标签的图文信息料进行标记处理,同时对图文信息进行特征向量提取,并将提取的特征向量与数据库中的信息进行匹配,然后对图文信息的标签进行细分标记;s4、对各细分标签后的信息进行相似度对比,并将相似度高于设定值的标签信息进行合并,组合成完整的信息标签体系;s5、选取完整标签体系中的一个或多个标签作为检测对象,并将标签内容与信息文本中的原始数据进行对比验证。2.根据权利要求1所述的一种基于战略领域信息文本的标签体系构建方法,其特征在于:所述步骤s2中的初步分类包括以下步骤:s201、根据图文信息提取关键图词信息集,所述关键图词信息集包括至少一个关键词信息;s202、根据所述关键词信息对比数据库中的原始信息,匹配所述关键词信息对应的类别信息;s203、根据匹配出的类别信息对待分类信息进行分类。3.根据权利要求1所述的一种基于战略领域信息文本的标签体系构建方法,其特征在于:所述步骤s3中对图文信息进行特征向量进行提取时,对未能识别的图文信息进行特征向量标记,同时将带有标记的特征向量信息与匹配后的图文信息进行相似度比对,并对未能识别的图文信息根据相似度进行穿插。4.根据权利要求1所述的一种基于战略领域信息文本的标签体系构建方法,其特征在于:所述步骤s4中的信息相似度对比包括以下步骤:s401、获取细分后的标签内容,并对标签内容进行图文特征提取;s402、对获取文本信息特征并进行逐一比对。5.根据权利要求1所述的一种基于战略领域信息文本的标签体系构建方法,其特征在于,所述步骤s3中对标签进行细分标记时,可以根据关键字信息对标签进行不同层级分类。6.根据权利要求5所述的一种基于战略领域信息文本的标签体系构建方法,其特征在于,所述层级的分类包括以下步骤:a1、建立统计对象的多维多层级分类,并使用分类系统对信息对象进行标注统计;a2、对所述标注统计信息聚类并关联数据库中的标签体系,得到多层级关键词列表;a3、参照数据库中的原始信息,对所述多层级关键词列表进行匹配,最终根据关键词得到各层级的信息标签。7.根据权利要求1所述的一种基于战略领域信息文本的标签体系构建方法,其特征在于,所述步骤s5中的对比验证包括以下步骤:b1、逐条选择系统体系中的标签,并获取当前标签对应层级标签的全部内容信息;b2、从数据库中调取对信息文本读取的词频和图片,从词频和图片中查与标签内容相关的信息,并对标签内容信息和数据库中的内容信息进行全面比对。

技术总结


本发明公开了一种基于战略领域信息文本的标签体系构建方法,包括以下步骤:获取预设战略信息文本,对信息文本中的词频和图片进行读取,然后将图文记录在数据库中,对读取的图文信息进行初步分类,然后选择对应的候选标签,对归类后的图文信息进行初级标签标识,本发明可以根据文本内容进行自动提取分类,同时可以对不能识别的信息进行相似度对比穿插,从而提高了对文本内容的保留,而且可以对标签信息进行不同层级的分类,还可以标签内容的相似度进行合并,有利于提高标签对象描述的准确性,构建后的标签体系可以进行进行复查,不仅完善了体系的步骤,而且不需要人工干预。而且不需要人工干预。而且不需要人工干预。


技术研发人员:

郭安明 孙涛

受保护的技术使用者:

郭安明

技术研发日:

2021.06.21

技术公布日:

2022/12/22

本文发布于:2024-09-23 09:29:42,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/45710.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:信息   标签   所述   图文
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议