一种基于改进LDA模型的对话模板匹配方法及装置与流程

一种基于改进lda模型的对话模板匹配方法及装置

技术领域

：
：1.本技术涉及通讯

技术领域

：
：，尤其涉及一种基于改进lda模型的对话模板匹配方法及装置。

背景技术

：
：：2.随着移动设备设备的普及，应用于终端设备的终端软件app被广泛使用，在这个背景下，为加大自助服务的建设，提高自助服务效率和服务质量，智能客服机器人应运而生，但是用户在与智能客服机器人沟通时常常会遇到智能机器人时常无法准确回答自己的问题，现在的智能机器人大多的逻辑就是根据客户的输入信息进行对话模板匹配，检测文本内容的相似性，最终从对话模板库中匹配对应的目标对话模板，现有技术中，匹配对应的目标对话模板一般使用隐含狄利克雷分布(latentdirichletallocation，lda)算法模型(又称文档主题生成模型)，但是现有隐含狄利克雷分布lda算法模型因为主题数的不确定，造成模型的匹配准确度降低，如何提高客服机器人对话模板匹配的准确度，提高客服机器人对话模板匹配效率是一个亟需解决的问题。技术实现要素：3.有鉴于此，本技术实施例提供了一种基于改进lda模型的对话模板匹配方法及装置，旨在通过改进lda模型提高客服机器人对话模板匹配的准确度和匹配效率。4.其方案包括：5.第一方面，本技术实施例提供了一种基于改进lda模型的对话模板匹配方法，所述方法包括：6.获取用户发送的对话数据；7.基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；8.将所述答复数据发送至用户。9.优选的，所述预先训练的文档主题生成lda模型，包括：10.获取训练对话数据集，所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题；11.将所述训练对话数据作为文档主题生成lda模型的输入，将所述对话数据对应的训练主题作为所述文档主题生成lda模型的的输出，并对所述文档主题生成lda模型进行训练，以获得所述预先训练的文档主题生成lda模型。12.优选的，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的，包括：13.以模型初始准确率作为所述蜻蜓算法的初始适应度，以模型初始主题数作为所述蜻蜓算法的初始位置，对所述预先训练的文档主题生成lda模型进行迭代更新，以得到最优主题数，其中，所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成lda模型后计算得到的；14.确定所述预先训练的文档主题生成lda模型的主题数为所述最优主题数，以得到所述预设的文档主题生成lda模型。15.优选的，所述基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，包括：16.将所述对话数据输入所述预设的文档主题生成lda模型，以获得所述用户的对话主题；17.基于预设的知识库映射关系，从预设的对话模板库中为所述对话主题匹配对话数据。18.第二方面，本技术实施例提供了一种基于改进lda模型的对话模板匹配装置，所述装置包括：19.获取模块，用于获取用户发送的对话数据；20.匹配模块，用于基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；21.发送模块，用于将所述答复数据发送至用户。22.优选的，所述预先训练的文档主题生成lda模型，包括：23.获取训练对话数据集，所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题；24.将所述训练对话数据作为文档主题生成lda模型的输入，并将所述对话数据对应的训练主题作为所述文档主题生成lda模型的的输出，对所述文档主题生成lda模型进行训练，以获得所述预先训练的文档主题生成lda模型。25.优选的，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的，包括：26.以模型初始准确率作为所述蜻蜓算法的初始适应度，以模型初始主题数作为所述蜻蜓算法的初始位置，对所述预先训练的文档主题生成lda模型进行迭代更新，以得到最优主题数，其中，所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成lda模型后计算得到的；27.确定所述预先训练的文档主题生成lda模型的主题数为所述最优主题数，以得到所述预设的文档主题生成lda模型。28.优选的，所述匹配模块包括：29.主题获取子模块，用于将所述对话数据输入所述预设的文档主题生成lda模型，以获得所述用户的对话主题；30.对话匹配子模块，用于基于预设的知识库映射关系，从预设的对话模板库中为所述对话主题匹配答复数据。31.第三方面，本技术实施例提供了一种电子设备，所述电子设备包括：32.存储器，用于存储一个或多个程序；33.处理器；当所述一个或多个程序被所述处理器执行时，实现前述第一方面任一项所述的方法。34.第四方面，本技术实施例提供了一种计算机存储介质，所述计算机存储介质中存储有程序，当所述程序被处理器执行时，实现前述第一方面任一项所述的方法。35.上述技术方案具有如下有益效果：36.本技术实施例提供了一种基于改进lda模型的对话模板匹配方法及装置。在执行所述方法时，获取用户发送的对话数据；基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；将所述答复数据发送至用户。由此可见，本实施例中基于蜻蜓算法对lda模型的主题数进行优化，确定lda模型的最优主题数，明确了lda模型的主题数，由此提高客服机器人对话模板匹配的准确度和匹配效率。附图说明37.为更清楚地说明本实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。38.图1为本技术实施例提供的一种基于改进lda模型的对话模板匹配方法流程示意图；39.图2为本技术实施例提供的一种基于改进lda模型的对话模板匹配装置结构示意图。具体实施方式40.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。41.在现有技术中，客服机器人匹配对应的目标对话模板一般使用lda算法模型，但是现有lda算法模型因为主题数的不确定，造成模型的匹配准确度降低，如何提高客服机器人对话模板匹配的准确度，提高客服机器人对话模板匹配效率是一个亟需解决的问题。42.为了解决上述技术问题，本技术实施例提供了一种基于改进lda模型的对话模板匹配方法，该方法可以由终端设备来执行。终端设备可以为移动终端(mobileterminal，mt)；比如，手机(mobilephone)、平板电脑(tabletpersonalcomputer，tabletpc)、台式电脑等等。以上仅仅是本技术实施例提供的终端的优选方式，优选终端的具体表现形式在此不做限定。43.需要说明的是，本技术提供的一种基于改进lda模型的对话模板匹配方法及装置可用于通讯

技术领域

：
：或金融领域。上述仅为实例，并不对本技术提供的一种基于改进lda模型的对话模板匹配方法及装置的应用领域进行限定。44.参见图1，图1为本技术实施例提供的基于改进lda模型的对话模板匹配方法的一种方法流程举例示意图，所述方法可以包括：45.步骤s101：获取用户发送的对话数据。46.具体的，对话数据可以是用户在客户端上与客服机器人对话涉及的信息数据，本技术不限制对话类型，可以是文字对话、语音对话、图片对话等，但需要说明的是，获取的对话数据应将各种类型的对话转化成文字数据。47.步骤s102：基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的。48.首先，需要对文档主题生成lda模型进行预先训练，训练过程包括步骤s1021至步骤s1022，如下：49.s1021：获取训练对话数据集，所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题。50.其中，训练对话数据集可以通过搜集用户与机器认客服的常见对话，并由人工标记对话数据对应的主题，将所述常见对话及其对应的主题对应存储作为所述训练对话数据集。51.s1022：将所述训练对话数据作为文档主题生成lda模型的输入，将所述对话数据对应的训练主题作为所述文档主题生成lda模型的的输出，并对所述文档主题生成lda模型进行训练，以获得所述预先训练的文档主题生成lda模型。52.具体的，将步骤s1021存储的训练对话数据集作为lda模型的训练集，对初始lda模型进行训练，得到所述预先训练的文档主题生成lda模型。53.需要说明的是，在机器学习领域，lda是两个常用模型的简称：线性判别分析(lineardiscriminantanalysis，lda)和隐含狄利克雷分布(latentdirichletallocation，lda)，在自然语言处理领域，隐含狄利克雷分布lda是一种处理文档的主题模型。本技术实施例中初始lda采用的即为隐含狄利克雷分布lda模型，隐含狄利克雷分布lda模型是常见的主题模型之一，是一类无监督学习算法，在训练时不需要手工标注的训练集，需要的仅仅是初始训练文档集以及指定主题的数量k即可。隐含狄利克雷分布lda模型的求解方式可以采用吉布斯采样(gibbssampling)算法进行求解，具体求解方式可以参见现有技术，本技术不对lda模型生成和模型求解原理展开论述。54.其次，基于蜻蜓算法(dragonflyalgorithm，da)对预先训练的文档主题生成lda模型的主题数k进行优化，具体的，由于现有的lda模型主题的数量k需要人为指定设置，技术人员仅能够依据经验设置，容易造成lda模型主题的数量k不是最优的主题数，因此，本技术实施例中采用蜻蜓仿生寻优算法获取lda模型的最优主体数量，包括如下步骤s1023至步骤s1024：55.步骤s1023：以模型初始准确率作为所述蜻蜓算法的初始适应度，以模型初始主题数作为所述蜻蜓算法的初始位置，对所述预先训练的文档主题生成lda模型进行迭代更新，以得到最优主题数，其中，所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成lda模型后计算得到的。56.采用预设的测试集输入预先训练的文档主题生成lda模型后可以计算得到lda模型的初始准确率，将所述lda模型的初始准确率作为蜻蜓算法的初始适应度。可以理解的是，预设的测试集的获得方式可以与训练对话数据集的获取方式一致，作为一种选择，测试集数据可以与训练对话数据集数据相同，简化模型获取步骤。57.lda模型的初始主体数作为蜻蜓算法中蜻蜓的的初始位置，并设置蜻蜓算法的参数包括蜻蜓最大迭代次数、种数量，将初始k值作为初始化位置x，以及初始化位置向量△x，通过不断迭代更新位置x，从而得到最优适应度，即获得最佳主题数(最佳k值)。58.作为一种示例，本技术实施例中蜻蜓最大迭代次数可以设置为200，种数量可以设置为30，需要说明的是，技术人员可以根据需求情况对蜻蜓算法中相关参数进行设置，本技术不对其做出限定。59.下面对蜻蜓算法的优化过程简单做出说明：蜻蜓算法寻优计算主要思路通过模拟蜻蜓的捕食行为来实现，该飞行(进化)寻优机制可以表示为蜻蜓体分离、对齐、聚集、食物吸引与天敌驱散五个步骤。60.一、分离，表示避免蜻蜓个体距离太近降低寻优效率，表示如下：[0061][0062]其中，si为蜻蜓i的分离度；x为当前蜻蜓的位置；n表示邻域内的个体数；xj为邻域内个体j的位置。[0063]二、对齐，表示某个蜻蜓与其邻近蜻蜓个体速度的相同程度，表示如下：[0064][0065]其中，ai为蜻蜓i的对齐度，vj为邻域内个体j的飞行速度，其他符号如前。[0066]三、聚集，表示某个蜻蜓具有朝着其附近较优蜻蜓个体靠近的趋势，表示如下：[0067][0068]其中，ci为蜻蜓i的聚集度，其他符号如前。[0069]四、食物吸引，表示某一次迭代计算中最优个体的位置，表示如下：[0070]fi＝x+-x，[0071]其中，fi为蜻蜓i的食物吸引度，x+为待趋近的目标位置，其他符号如前。[0072]五、天敌驱散，表示使个体尽可能远离最差的蜻蜓个体，提高寻优计算效率：[0073]ei＝x-+x，[0074]其中，ei为蜻蜓i的天敌驱散度，x-为天敌的位置，其他符号如前。[0075]基于上述蜻蜓体分离、对齐、聚集、食物吸引与天敌驱散五个步骤，将初始化位置向量△x，即步长，初始位置x，代入下式进行蜻蜓个体i飞行位置补偿更新：[0076]δxt+1＝(ssi+aai+cci+ffi+eei)+wδxt，[0077]以及蜻蜓飞行位置的更新：[0078]xt+1＝xt+δxt+1，[0079]其中，△xt为t时刻蜻蜓i的位置向量，△xt+1为下一时刻t+1时刻蜻蜓i的位置向量，xt为t时刻蜻蜓i的位置，xt+1为下一时刻t+1时刻蜻蜓i的位置，s、a、c、f、e、w分别为分离权重、对齐权重、聚集权重、猎物权重、天敌权重、惯性权重，可以根据实际情况进行设置。[0080]由上，通过将lda模型的初始主题数作为蜻蜓算法的初始位置x，通过蜻蜓算法的优化计算，获得最优蜻蜓位置作为最优解，即最优主题数k。[0081]步骤s1024：确定所述预先训练的文档主题生成lda模型的主题数为所述最优主题数，以得到所述预设的文档主题生成lda模型。[0082]具体的，将所述最佳主题数k值确定为所述预先训练的文档主题生成lda模型的主题数，得到所述预设的文档主题生成lda模型。[0083]由此得到优化确定的最优主题数的lda模型，明确了lda模型的主题数，提高后续进行对话模板匹配的准确度和匹配效率。[0084]最后，步骤s102中所述基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，包括：[0085]将所述对话数据输入所述预设的文档主题生成lda模型，以获得所述用户的对话主题；基于预设的知识库映射关系，从预设的对话模板库中为所述对话主题匹配对话数据。[0086]具体的，将用户发送的对话数据输入预设的文档主题生成lda模型，获得该用户的对话主题，并基于预设的知识库映射关系，从预设的对话模板库匹配对应的答复数据。[0087]可以理解的是，预设的对话模板库中存储有多个答复数据，不同答复数据对应不同的对话主题，预设的知识库映射关系中存储有对话主题和答复数据的对应关系。[0088]步骤s103：将所述答复数据发送至用户。[0089]将匹配得到的答复数据发送至对应用户，完成客服机器人与该用户的从上述技术方案可以看出，本技术实施例提供了一种基于改进lda模型的对话模板匹配方法。在执行所述方法时，获取用户发送的对话数据；基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复对话数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；将所述答复对话数据发送至用户。由此可见，本实施例中基于蜻蜓算法对lda模型的主题数进行优化，确定lda模型的最优主题数，明确了lda模型的主题数，提高客服机器人对话模板匹配的准确度和匹配效率。[0090]以上为本技术实施例提供的一种基于改进lda模型的对话模板匹配方法的一些具体实现方式，基于此，本技术还提供了对应的装置。下面将从功能模块化的角度对本技术实施例提供的装置进行介绍。[0091]参见图2所示的一种基于改进lda模型的对话模板匹配装置结构示意图，该装置可以包括：[0092]获取模块100，用于获取用户发送的对话数据；[0093]匹配模块200，用于基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；[0094]发送模块300，用于将所述答复数据发送至用户。[0095]作为一种优选的实施例，匹配模块200中所述预先训练的文档主题生成lda模型，包括：[0096]获取训练对话数据集，所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题；[0097]将所述训练对话数据作为文档主题生成lda模型的输入，并将所述对话数据对应的训练主题作为所述文档主题生成lda模型的的输出，对所述文档主题生成lda模型进行训练，以获得所述预先训练的文档主题生成lda模型。[0098]作为一种优选的实施例，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的，包括：[0099]以模型初始准确率作为所述蜻蜓算法的初始适应度，以模型初始主题数作为所述蜻蜓算法的初始位置，对所述预先训练的文档主题生成lda模型进行迭代更新，以得到最优主题数，其中，所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成lda模型后计算得到的；[0100]确定所述预先训练的文档主题生成lda模型的主题数为所述最优主题数，以得到所述预设的文档主题生成lda模型。[0101]所述匹配模块200包括：[0102]主题获取子模块201，用于将所述对话数据输入所述预设的文档主题生成lda模型，以获得所述用户的对话主题；[0103]对话匹配子模块202，用于基于预设的知识库映射关系，从预设的对话模板库中为所述对话主题匹配答复数据。[0104]本技术实施例提供了一种基于改进lda模型的对话模板匹配装置，所述装置包括：获取模块，用于获取用户发送的对话数据；匹配模块，用于基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；发送模块，用于将所述答复数据发送至用户。由此可见，本实施例中基于蜻蜓算法对lda模型的主题数进行优化，确定lda模型的最优主题数，明确了lda模型的主题数，提高客服机器人对话模板匹配的准确度和匹配效率。[0105]本技术实施例还提供了一种电子设备，包括：存储器，用于存储一个或多个程序；[0106]处理器；当所述一个或多个程序被所述处理器执行时，实现上述实施例中的方法。[0107]本技术实施例提供了一种计算机存储介质，所述计算机存储介质中存储有程序，当所述程序被处理器执行时，实现上述实施例中的方法。[0108]本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。[0109]本领域技术人员可以理解，图所示的流程图仅是本技术的实施方式可以在其中得以实现的一个示例，本技术实施方式的适用范围不受到该流程图任何方面的限制。[0110]在本技术所提供的几个实施例中，应该理解到，所揭露的方法、装置和设备，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。[0111]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。[0112]所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。[0113]对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12当前第1页12

技术特征：

1.一种基于改进lda模型的对话模板匹配方法，其特征在于，所述方法包括：获取用户发送的对话数据；基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；将所述答复数据发送至用户。2.根据权利要求1所述的方法，其特征在于，所述预先训练的文档主题生成lda模型，包括：获取训练对话数据集，所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题；将所述训练对话数据作为文档主题生成lda模型的输入，将所述对话数据对应的训练主题作为所述文档主题生成lda模型的的输出，并对所述文档主题生成lda模型进行训练，以获得所述预先训练的文档主题生成lda模型。3.根据权利要求2所述的方法，其特征在于，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的，包括：以模型初始准确率作为所述蜻蜓算法的初始适应度，以模型初始主题数作为所述蜻蜓算法的初始位置，对所述预先训练的文档主题生成lda模型进行迭代更新，以得到最优主题数，其中，所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成lda模型后计算得到的；确定所述预先训练的文档主题生成lda模型的主题数为所述最优主题数，以得到所述预设的文档主题生成lda模型。4.根据权利要求3所述的方法，其特征在于，所述基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，包括：将所述对话数据输入所述预设的文档主题生成lda模型，以获得所述用户的对话主题；基于预设的知识库映射关系，从预设的对话模板库中为所述对话主题匹配答复数据。5.一种基于改进lda模型的对话模板匹配装置，其特征在于，所述装置包括：获取模块，用于获取用户发送的对话数据；匹配模块，用于基于预设的文档主题生成lda模型，从预设的对话模板库中为所述对话数据匹配答复数据，其中，所述预设的文档主题生成lda模型是基于蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的；发送模块，用于将所述答复数据发送至用户。6.根据权利要求5所述的装置，其特征在于，所述预先训练的文档主题生成lda模型，包括：获取训练对话数据集，所述训练对话数据集包括训练对话数据以及所述对话数据对应的训练主题；将所述训练对话数据作为文档主题生成lda模型的输入，并将所述对话数据对应的训练主题作为所述文档主题生成lda模型的的输出，对所述文档主题生成lda模型进行训练，以获得所述预先训练的文档主题生成lda模型。7.根据权利要求6所述的装置，其特征在于，所述预设的文档主题生成lda模型是基于
蜻蜓算法对预先训练的文档主题生成lda模型的主题数优化得到的，包括：以模型初始准确率作为所述蜻蜓算法的初始适应度，以模型初始主题数作为所述蜻蜓算法的初始位置，对所述预先训练的文档主题生成lda模型进行迭代更新，以得到最优主题数，其中，所述模型初始准确率是预设测试集输入所述预先训练的文档主题生成lda模型后计算得到的；确定所述预先训练的文档主题生成lda模型的主题数为所述最优主题数，以得到所述预设的文档主题生成lda模型。8.根据权利要求7所述的装置，其特征在于，所述匹配模块包括：主题获取子模块，用于将所述对话数据输入所述预设的文档主题生成lda模型，以获得所述用户的对话主题；对话匹配子模块，用于基于预设的知识库映射关系，从预设的对话模板库中为所述对话主题匹配答复数据。9.一种电子设备，其特征在于，包括：存储器，用于存储一个或多个程序；处理器；当所述一个或多个程序被所述处理器执行时，实现如权利要求1至4中任一项所述的方法。10.一种存储介质，其特征在于，所述存储介质上存储有程序，所述程序被处理器执行时实现权利要求1至4中任一项所述方法。

技术总结

本申请公开了一种基于改进LDA模型的对话模板匹配方法及装置，可应用于通讯技术领域或金融领域。在执行所述方法时，获取用户发送的对话数据；基于预设的文档主题生成LDA模型，从预设的对话模板库中为所述对话数据匹配答复对话数据，其中，所述预设的文档主题生成LDA模型是基于蜻蜓算法对预先训练的文档主题生成LDA模型的主题数优化得到的；将所述答复对话数据发送至用户。由此可见，本申请基于蜻蜓算法对LDA模型的主题数进行优化，确定LDA模型的最优主题数，明确了LDA模型的主题数，提高客服机器人对话模板匹配的准确度和匹配效率。机器人对话模板匹配的准确度和匹配效率。机器人对话模板匹配的准确度和匹配效率。