合同条款风险智能识别方法、装置、电子设备及存储介质[发明专利]

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202011302890.3
(22)申请日 2020.11.19
(71)申请人 京北方信息技术股份有限公司
地址 100089 北京市海淀区西三环北路25
号青政大厦7层
(72)发明人 徐健 高昊江 杨飞 
(74)专利代理机构 北京品源专利代理有限公司
11332
代理人 孟金喆
(51)Int.Cl.
G06F  40/30(2020.01)
G06K  9/00(2006.01)
G06K  9/62(2006.01)
G06N  3/08(2006.01)
G06Q  10/06(2012.01)
G06Q  50/18(2012.01)
(54)发明名称
合同条款风险智能识别方法、装置、电子设
备及存储介质
(57)摘要
本发明公开了一种合同条款风险智能识别
方法、装置、电子设备及存储介质。该方法包括:
获取待识别的合同条款文本,将所述待识别的合
同条款文本转换为文本序列;基于条款风险识别
模型对所述文本序列进行风险识别,得到所述条
款风险识别模型输出的条款风险识别结果,其
中,所述条款风险识别模型包括依次设置的文本
序列处理网络层、语义关系提取网络层、语义特
征提取网络层和风险分类网络层,在减轻了法务
工作者的工作负担、提高审核效率的同时,更增
强了交易安全性、
降低经济损失。权利要求书2页  说明书10页  附图3页CN 112232088 A 2021.01.15
C N  112232088
A
1.一种合同条款风险识别方法,其特征在于,应用于合同法律风险审批领域,包括:
获取待识别的合同条款文本,将所述待识别的合同条款文本转换为文本序列;
基于条款风险识别模型对所述文本序列进行风险识别,得到所述条款风险识别模型输出的条款风险识别结果,其中,所述条款风险识别模型包括依次设置的文本序列处理网络层、语义关系提取网络层、语义特征提取网络层和风险分类网络层。
2.根据权利要求1所述的方法,其特征在于,所述将所述待识别的合同条款文本转换为文本序列,包括:
对所述待识别的合同条款文本进行预处理,其中,所述预处理包括去除合同条款文本中的不可读字符与空格;
将预处理后的合同条款文本进行文本令牌序列转换处理,并在转换得到的初始文本序列的起始位置添加文本任务标识,生成所述合同条款文本对应的文本序列,其中,所述文本序列公式表述为:Token s
eq=Concat(Token task,Token input);其中,Token seq表示所述合同条款完整的文本序列;Token task表示所述合同条款的识别任务标识;Token input表示所述合同条款的文本内容。
3.根据权利要求1所述的方法,其特征在于,所述获取待识别的合同条款文本,包括:
获取待识别的合同文本,并对所述合同文本中的合同条款进行拆分,确定所述合同文本中的各待识别的合同条款文本。
4.根据权利要求1所述的方法,其特征在于,所述基于条款风险识别模型对所述文本序列进行风险识别,包括:
基于所述文本序列处理网络层确定输入的文本序列中的各文本令牌对应的至少一个词向量,得到所述文本序列对应的词向量序列;
基于所述语义关系提取网络层提取所述词向量序列中各词向量之间的语义关系,生成第一语义向量序列;
基于所述语义特征提取网络层对所述第一语义向量序列进行非线性处理,得到第二语义向量序列;
基于所述风险分类网络层对所述第一语义向量序列和所述第二语义向量序列进行风险识别,得到所述条款风险识别结果。
5.根据权利要求4所述的方法,其特征在于,所述基于所述风险分类网络层对所述第一语义向量序列和所述第二语义向量序列进行风险识别,得到所述条款风险识别结果,包括:基于第一公式对所述第一语义向量序列和所述第二语义向量序列的和进行归一化处
理,其中,所述第一公式为:其中,x表示本层归一化函数的输入;μ
表示输入的平均值;σ表示输入的标准差;
基于所述风险分类网络层对归一化结果进行风险识别,得到所述条款风险识别结果,其中,所述识别结果为:其中,n表示风险类别的数量;x i表示第i维输入;
x j表示第j维输入。
6.根据权利要求1所述的方法,其特征在于,所述条款风险识别模型的训练方法包括:
获取用于模型训练的历史合同条款,并确定各历史合同条款的风险标签,其中,历史合同条款包括正样本合同条款和负样本合同条款;
基于各所述历史合同条款对待训练的条款风险识别模型进行如下迭代训练,直到迭代训练的条款风险识别模型满足预设条件,得到训练完成的条款风险识别模型:将任一历史合同条款输入至对待训练的条款风险识别模型,得到所述历史合同条款的风险预测结果;
基于所述风险预测结果和所述历史合同条款的风险标签生成损失函数,并基于所述损失函数对所述待训练的条款风险识别模型进行参数调节。
7.根据权利要求1所述的方法,其特征在于,所述条款风险识别结果包括:风险条款和无风险条款;
所述在得到所述条款风险识别模型输出的条款风险识别结果之后,还包括:
根据各合同条款文本的条款风险识别结果在待识别合同文本对各合同条款文本进行区别显示。
8.一种合同条款风险识别装置,其特征在于,包括:
文本序列获取模块,用于获取待识别的合同条款文本,将所述待识别的合同条款文本转换为文本序列;
条款风险识别模块,用于基于条款风险识别模型对所述文本序列进行风险识别,得到所述条款风险识别模型输出的条款风险识别结果,其中,所述条款风险识别模型包括依次设置的文本序列处理网络层、语义关系提取网络层、语义特征提取网络层和风险分类网络层。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的合同条款风险识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的合同条款风险识别方法。
合同条款风险智能识别方法、装置、电子设备及存储介质
技术领域
[0001]本发明实施例涉及合同法律风险审批领域,尤其涉及一种合同条款风险智能识别方法、装置、电子设备及存储介质。
背景技术
[0002]我国的中小微企业约有8000万家,其每年签订的合同至少有40亿份,法院每年受理的合同诉讼案件有500万之多,约占总民商事案件的一半以上,因合同纠纷而造成的经济损失超过1万亿元。合同条款风险审核是政府和企业规避合同风险的有力武器,签约前的合同审核更能有效地避免合同纠纷。
[0003]目前来说,合同条款的风险判断工作主要还是依靠法律专业人员的专业知识、执业经验、合同当事方的需求结合当前有效的法律法规来判定一个合同条款是否存在法律风险,这是一个很费时费力的过程。不仅为相关法律人员带来巨大的工作量,同时也使得整个的过程的效率下降。对于非专业法律人来说,去判定一个合同条款是否存在风险更是存在一定困难。
发明内容
[0004]本发明提供一种合同条款风险智能识别方法、装置、电子设备及存储介质,在减轻了法务工作者的工作负担、提高审核效率的同时,更增强了交易安全性、降低经济损失。[0005]第一方面,本发明实施例提供了一种合同条款风险识别方法,应用于合同法律风险审批领域,该方法包括:
[0006]获取待识别的合同条款文本,将所述待识别的合同条款文本转换为文本序列;[0007]基于条款风险识别模型对所述文本序列进行风险识别,得到所述条款风险识别模型输出的条款风险识别结果,其中,所述条款风险识别模型包括依次设置的文本序列处理网络层、语义关系提取网络层、语义特征提取网络层和风险分类网络层。
[0008]第二方面,本发明实施例还提供了一种合同条款风险识别装置,该装置包括:[0009]文本序列获取模块,用于获取待识别的合同条款文本,将所述待识别的合同条款文本转换为文本序列;
[0010]条款风险识别模块,用于基于条款风险识别模型对所述文本序列进行风险识别,得到所述条款风险识别模型输出的条款风险识别结果,其中,所述条款风险识别模型包括依次设置的文本序列处理网络层、语义关系提取网络层、语义特征提取网络层和风险分类网络层。
[0011]第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
[0012]一个或多个处理器;
[0013]存储装置,用于存储一个或多个程序,
[0014]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例提供的合同条款风险识别方法。
[0015]第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的合同条款风险识别方法。[0016]本发明通过获取待识别的合同条款文本,将所述待识别的合同条款文本转换为文本序列;基于条款风险识别模型中文本序列处理网络层得到了文本序列对应的词向量序列,基于语义关系提取网络层生成第一语义向量序列,基于语义特征提取网络层生成第二语义向量序列,基于风险分类网络层对第一语义向量序列和第二语义向量序列进行风险识别,得到条款风险识别结果,在减轻了法务工作者的工作负担、提高审核效率的同时,更增强了交易安全性、降低经济损失。
附图说明
[0017]图1是本发明实施例一提供的一种合同条款风险识别方法的流程示意图;[0018]图2是本发明实施例一提供的另一种合同条款风险识别方法的流程示意图;[0019]图3是本发明实施例二提供的另一种合同条款风险识别方法的流程示意图;[0020]图4是本发明实施例三提供的一种合同条款风险识别装置的结构示意图;[0021]图5为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
[0022]下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0023]实施例一
[0024]图1为本发明实施例一提供的一种合同条款风险识别方法的流程图,本实施例可适用于在双方签订合同之前对合同进行法律风险审核的情况。该方法可以由合同条款风险识别装置来执行,该装置可以由软件和/或硬件的方式来实现。如图1所示,该方法具体包括以下步骤:
[0025]S110、获取待识别的合同条款文本,将所述待识别的合同条款文本转换为文本序列。
[0026]由于合同的特殊性、合同履行的长期性和合同履行的多样性、复杂性等特点,使得合同条款中存在的风险责任是合同双方无法回避的,因此需要在合同签订前对合同条款进行风险识别以达到规避风险的目的。获取待识别的合同文本,其中,当待识别的合同文本为电子文本时,可直接获取电子文本的存储位置以获取待识别的合同文本;当待识别的合同文本为纸质文本时,可以获取合同文本的文本图像,并通过识别文本图像中的文字内容并将图像转换为文本格式的待识别文本合同。可选的,可以采用光学字符识别技术识别所述文本图像中的文字内容。具体的,光学字符识别技术即O CR(O pti ca l Cha ra c te r Recognition)技术,是利用电子设备对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。利用OCR技术对纸质合同文本图像中的文字内容进行识别,既可以保证识别结果的准确性,同时也有利于提高合同文本信息的处理效率。当然,还可通过其他文字识别技术进行文字识别,本申请在此不做限制。
[0027]对待识别的合同文本进行拆分,以确定合同文本中各待识别的合同条款文本。可

本文发布于:2024-09-21 18:30:38,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/736526.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:风险   识别   文本   合同条款
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议