一种在线教育课堂教学资源的知识图谱构建方法[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202011599245.2
(22)申请日 2020.12.30
(71)申请人 南京云起网络科技有限公司
地址 210000 江苏省南京市江宁区秣陵街
道秣周东路12号
(72)发明人 杨东亮 
(74)专利代理机构 南京源古知识产权代理事务
所(普通合伙) 32300
代理人 马晓辉
(51)Int.Cl.
G06F  16/36(2019.01)
G06F  16/25(2019.01)
G06K  9/20(2006.01)
G06F  16/11(2019.01)
G06F  16/951(2019.01)
G06Q  50/20(2012.01)
(54)发明名称
一种在线教育课堂教学资源的知识图谱构
建方法
(57)摘要
本发明公开一种在线教育课堂教学资源的
知识图谱构建方法,包括如下步骤:教学资源本
体的构建、教学资源数据源的配置、教学资源信
息的抽取、教学资源的知识融合,该方法采用两
种形式对教学资源本体进行构建,可以提高知识
图谱构建的范围,结合教学资源信息的抽取与教
学资源的知识融合,提高知识图谱的准确性,便
于不受地域限制、不受场地限制等高灵活性教
学。权利要求书1页  说明书3页  附图2页CN 112579796 A 2021.03.30
C N  112579796
A
1.一种在线教育课堂教学资源的知识图谱构建方法,其特征在于:包括如下步骤:
教学资源本体的构建:(1)梳理教学知识、术语词典、常规用语等作为本体构建的基础,
获得教学资源中的关键词,将关键词对应的教学内容存储在数据库中,
形成数据链接;(2)通过爬虫技术进行爬取,并进行筛选处理,存储在数据库中;
爬虫步骤分为数据采集、数据处理以及数据存储三部分;
教学资源数据源的配置:根据不同形式的教学资源材料进行电子化文本文档的转换,转换后对数据进行配置;
教学资源信息的抽取:按照数据的结构分为结构化数据、半结构化数据、非结构化数据的抽取,针对不同结构的数据使用不同的抽取方法;
教学资源的知识融合:多个数据进行知识抽取后的大量三元组数据进行对齐合并,通过定义相似度度量及组合,完成实体对齐及知识融合。
2.根据权利要求1所述的一种在线教育课堂教学资源的知识图谱构建方法,其特征在于:在教学资源数据源配置之前,将不同类型、不同格式的数据进行初步的整理,整理方式如下:
针对本地非电子化文档,需要先进行扫描电子化,结合OCR技术将扫描件转换为文本文档;
针对本地电子化文档,将本地文档按文档类型、格式进行归档解析整理成规范的格式;针对网络资源,根据网站特点,开发相应的爬虫,对数据进行爬取,并存储到本地数据库中;
针对第三方资源,获取相应的数据访问接口,通过接口获取相应的数据。
3.根据权利要求1所述的一种在线教育课堂教学资源的知识图谱构建方法,其特征在于:教学资源信息的抽取是根据不同的数据源、不同的数据格式,完成实体、属性、关系的抽取。
4.根据权利要求1所述的一种在线教育课堂教学资源的知识图谱构建方法,其特征在于:教学资源的知识融合中三元组包括实体、关系和属性。
权 利 要 求 书1/1页CN 112579796 A
一种在线教育课堂教学资源的知识图谱构建方法
技术领域
[0001]本发明属于网络教育技术领域,具体涉及到一种在线教育课堂教学资源的知识图谱构建方法。
背景技术
[0002]随着数据科学的蓬勃发展,深度学习的广泛应用,人工智能技术也取得了飞速的发展,伴随着智能手机、平板、电脑等智能终端设备的大规模普及,4G、5G等移动网络资源的逐渐成熟,人类社会已经开始进入智能时代,在当前的形式下,数字化和移动化在线学习已成为人们接受教育的新途径,在线教育是利用互联网技术和通信技术优化师生的交流方式和上课方式的一种新型教育方式,相较于传统的面授教育,在线教育具有不受地域限制、不受场地限制等高灵活性优点,而在线教育的前提是对教学资源的知识图谱进行构建。[0003]知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,知识图谱是把实体表示成节点,实体的属性,实体间的关系表示成边,构成了一个网状的图结构,这种结构化的形式人类可识别,对机器也很友好,方便机器理解,图谱中大规模的概念,属性,实体之间关系,让其具有丰富的语义信息,丰富关联信息,天然具有图的各种特征,可以进行图的相关操作与应用,因此,为了便于在线教育,本发明提供一种在线教育课堂教学资源的知识图谱构建方法。
发明内容
[0004]针对上述问题,本发明的主要目的在于设计一种在线教育课堂教学资源的知识图谱构建方法,教学资源本体的构建采用两种形式,可以加大知识图谱的构建范围,结合抽取与融合,提高知识图谱的准确性,便于不受地域限制、不受场地限制等高灵活性教学。[0005]为了实现上述目的本发明采用如下技
术方案:
一种在线教育课堂教学资源的知识图谱构建方法,包括如下步骤:
教学资源本体的构建:(1)梳理教学知识、术语词典、常规用语等作为本体构建的基础,获得教学资源中的关键词,将关键词对应的教学内容存储在数据库中,形成数据链接;
(2)通过爬虫技术进行爬取,并进行筛选处理,存储在数据库中;
爬虫步骤分为数据采集、数据处理以及数据存储三部分;
教学资源数据源的配置:根据不同形式的教学资源材料进行电子化文本文档的转换,转换后对数据进行配置;
教学资源信息的抽取:按照数据的结构分为结构化数据、半结构化数据、非结构化数据的抽取,针对不同结构的数据使用不同的抽取方法;
教学资源的知识融合:多个数据进行知识抽取后的大量三元组数据进行对齐合并,通过定义相似度度量及组合,完成实体对齐及知识融合。
[0006]作为本发明进一步的描述,在教学资源数据源配置之前,将不同类型、不同格式的数据进行初步的整理,整理方式如下:
针对本地非电子化文档,需要先进行扫描电子化,结合OCR技术将扫描件转换为文本文档;
针对本地电子化文档,将本地文档按文档类型、格式进行归档解析整理成规范的格式;
针对网络资源,根据网站特点,开发相应的爬虫,对数据进行爬取,并存储到本地数据库中;
针对第三方资源,获取相应的数据访问接口,通过接口获取相应的数据。[0007]作为本发明进一步的描述,教学资源信息的抽取是根据不同的数据源、不同的数据格式,完成实体、属性、关系的抽取。
[0008]作为本发明进一步的描述,教学资源的知识融合中三元组包括实体、关系和属性。[0009]相对于现有技术,本发明的技术效果为:
本发明提供了一种在线教育课堂教学资源的知识图谱构建方法,采用两种形式对教学资源本体进行构建,可以提高知识图谱构建的范围,结合教学资源信息的抽取与教学资源的知识融合,提高知识图谱的准确性,便于不受地域限制、不受场地限制等高灵活性教学。
附图说明
[0010]图1为本发明的整体流程视图;
图2为本发明的爬虫工作视图;
图3为本发明的教学资源信息的抽取视图。
具体实施方式
[0011]下面结合附图对本发明进行详细描述:
一种在线教育课堂教学资源的知识图谱构建方法,参考图1‑3所示,包括如下步骤:
教学资源本体的构建:(1)梳理教学知识、术语词典、常规用语等作为本体构建的基础,获得教学资源中的关键词,将关键词对应的教学内容存储在数据库中,形成数据链接;
(2)通过爬虫技术进行爬取,并进行筛选处理,存储在数据库中;
网络爬虫是一段能够自动获取网页内容的脚本或者程度,它按照一定的规则,自动抓取网页的内容,采集网页信息,甚至可以循环采集所有它能访问到的网站的信息,它的步骤分为数据采集、数据处理以及数据存储三部分;
采用爬虫技术获取多家教育网站的题目和知识点等信息,并通过数据预处理模块去掉雷同题目和知识点,完成数据融合。
[0012]教学资源数据源的配置:根据不同形式的教学资源材料进行电子化文本文档的转换,转换后对数据进行配置;
教学资源信息的抽取:按照数据的结构分为结构化数据、半结构化数据、非结构化
数据的抽取,针对不同结构的数据使用不同的抽取方法;
结构化数据和半结构化数据可以用专有工具将其转换成三元组,非结构化的数据需要结合自然语言处理技术进行信息抽取。
[0013]教学资源的知识融合:多个数据进行知识抽取后的大量三元组数据进行对齐合并,通过定义相似度度量及组合,完成实体对齐及知识融合。
[0014]在教学资源数据源配置之前,将不同类型、不同格式的数据进行初步的整理,整理方式如下:
针对本地非电子化文档,需要先进行扫描电子化,结合OCR技术将扫描件转换为文本文档;
针对本地电子化文档,将本地文档按文档类型、格式进行归档解析整理成规范的格式;
针对网络资源,根据网站特点,开发相应的爬虫,对数据进行爬取,并存储到本地数据库中;
针对第三方资源,获取相应的数据访问接口,通过接口获取相应的数据。[0015]教学资源信息的抽取是根据不同的数据源、不同的数据格式,完成实体、属性、关系的抽取。
[0016]教学资源的知识融合中三元组包括实体、关系和属性。
[0017]实体类节点,指的是有明显意义和区别性的某种事物,如某个学生,某一个知识点,某一道题目等等,教学资源的知识点也就是由这些具体的事物组成,这就是实体,实体是知识图谱中最基本的元素,不同的实体之间一般存在着不同的关系。
[0018]关系,是指从一个实体到另一个实体的关系,关系可以是一对一,一对多或者多对多。
[0019]属性类节点,指的是一个实体的属性值,知识点的属性有名称、范畴、历史等属性,是从一个实体引出的不同的边。
[0020]本发明提供了一种在线教育课堂教学资源的知识图谱构建方法,采用两种形式对教学资源本体进行构建,可以提高知识图谱构建的范围,结合教学资源信息的抽取与教学资源的知识融合,提高知识图谱的准确性。
[0021]以上实施例仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其他修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

本文发布于:2024-09-20 15:37:49,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/2/462267.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:知识   数据   进行   教学资源   构建   图谱   技术
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议