基于模型的店铺营业数据分析方法、装置、系统及介质与流程



1.本发明涉及计算机技术领域,尤其涉及基于模型的店铺营业数据分析方法、装置、系统及介质。


背景技术:



2.连锁经营是现代商业最为主要的经营形态,在连锁经营中,店铺选址对经营数据的影响非常大,因此如何在新门店开业前准确预测分析店铺营业数据,来决定是否开设门店显得尤为重要。
3.目前针对店铺的营业数据评估主要通过线下实地考察的方式,根据经营者的经验对线下的选址周围经营情况进行判断,人为主观性大,非常容易造成预测偏差;或者还有通过线下采集目标位置处不同时间段的人流量数据、临近店铺的进店率以及客单价等信息来预估目标位置的营业额,这种方式在针对每个目标位置进行预测时,均需单独进行数据采集,导致预测效率很低,且人流量、进店率、客单价等关键变量的影响因素众多,难以确保根据采集到的数据所预测得到的营业数据的准确性。


技术实现要素:



4.鉴于上述现有技术的不足,本发明的目的在于提供基于模型的店铺营业数据分析方法、装置、系统及介质,旨在提高店铺营业数据分析的效率和准确性。
5.本发明的技术方案如下:
6.一种基于模型的店铺营业数据分析方法,包括:
7.采集现有店铺的店铺信息并构建训练样本集,其中,所述店铺信息包括店铺数据、位置数据和营业数据;
8.根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类;
9.根据所述训练样本集中每个样本类别中的店铺信息以及所述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型;
10.获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别;
11.将所述目标位置输入至所述目标类别对应的营业分析模型中,输出相应的营业数据分析结果。
12.在一个实施例中,所述采集现有店铺的店铺数据并构建训练样本集之后,所述方法还包括:
13.对所述训练样本集进行样本预处理和样本扩量处理。
14.在一个实施例中,所述对所述训练样本集进行样本预处理和样本扩量处理,包括:
15.将所述训练样本集中的位置数据转换为经纬度数据;
16.根据所述店铺数据,对所述训练样本集进行正样本扩量处理;
17.根据所述店铺数据和经纬度数据,对所述训练样本集进行负样本扩量处理。
18.在一个实施例中,所述根据所述店铺数据和经纬度数据,对所述训练样本集进行负样本扩量处理,包括:
19.根据所述店铺数据,获取相应品牌的门店分布比例高于预设比例的城市并调取所述城市的geohash数据;
20.对所述城市的geohash数据进行过滤,筛选得到业态分布指标大于预设指标的目标区域;
21.根据所述经纬度数据将所述现有店铺的geohash数据插入至所述目标区域的geohash数据中,将所述目标区域划分为有品牌门店区域和无品牌门店区域;
22.在所述无品牌门店区域中确认业态分布信息与所述有品牌门店区域相似的区域作为负样本,对所述训练样本集进行负样本扩量处理。
23.在一个实施例中,所述根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类,包括:
24.根据所述训练样本集中每个现有店铺的业态分布信息,计算每个分析维度的iv值;
25.将所述iv值处于预设范围的分析维度确认为关键分析维度;
26.根据所述训练样本集中每个现有店铺的业态分布信息,通过降维分类算法将所述训练样本集中的现有店铺划分为若干个样本类别,每个样本类别具有相似的业态分布特征。
27.在一个实施例中,所述根据所述训练样本集中每个样本类别中的店铺信息以及所述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型,包括:
28.将每个样本类别的店铺信息以及所述关键分析维度的分布数据分别输入至多元回归模型中,进行模型拟合训练;
29.在达到预设拟合条件时结束模型训练,输出每个样本类别下每个关键分析维度的权重系数以及整体偏移量,生成每个样本类别下的营业分析模型。
30.在一个实施例中,所述获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别,包括:
31.获取待分析的目标位置;
32.根据所述目标位置的业态分布信息与每个样本分类的业态分布特征进行匹配,输出与每个样本分类的匹配概率;
33.将匹配概率最高的样本分类作为所述目标位置的目标类别。
34.一种基于模型的店铺营业数据分析装置,包括:
35.样本采集模块,用于采集现有店铺的店铺信息并构建训练样本集,其中,所述店铺信息包括店铺数据、位置数据和营业数据;
36.样本处理与分类模块,用于根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类;
37.模型训练模块,用于根据所述训练样本集中每个样本类别中的店铺信息以及所述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型;
38.目标分类模块,用于获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别;
39.分析模块,用于将所述目标位置输入至所述目标类别对应的营业分析模型中,输出相应的营业数据分析结果。
40.一种基于模型的店铺营业数据分析系统,所述系统包括至少一个处理器;以及,
41.与所述至少一个处理器通信连接的存储器;其中,
42.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述基于模型的店铺营业数据分析方法。
43.一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的基于模型的店铺营业数据分析方法。
44.有益效果:本发明公开了基于模型的店铺营业数据分析方法、装置、系统及介质,相比于现有技术,本发明实施例通过采集现有店铺的信息,基于关键分析维度对不同业态分布特点的同类店铺进行营业分析模型的训练,使模型能基于任意目标位置输出营业数据分析结果,提高店铺营业分析的效率和准确性。
附图说明
45.下面将结合附图及实施例对本发明作进一步说明,附图中:
46.图1为本发明实施例提供的基于模型的店铺营业数据分析方法的一个流程图;
47.图2为本发明实施例提供的基于模型的店铺营业数据分析装置的功能模块示意图;
48.图3为本发明实施例提供的基于模型的店铺营业数据分析系统的硬件结构示意图。
具体实施方式
49.为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。以下结合附图对本发明实施例进行介绍。
50.请参阅图1,图1为本发明提供的基于模型的店铺营业数据分析方法一个实施例的流程图。如图1所示,该方法具体包括如下步骤:
51.s100、采集现有店铺的店铺信息并构建训练样本集,其中,所述店铺信息包括店铺数据、位置数据和营业数据。
52.本实施例中,对于连锁品牌早已存在大量的现有店铺,这些现有店铺的店铺信息包括类型、品牌等店铺数据、位置数据以及营业额或者营业额等级的营业数据,可作为样本数据为后续计划店铺的营业数据分析提供准确的数据基础,因此采集现有店铺的店铺信息并构建训练样本集用于后续的模型训练,以实现量化客观的营业数据分析。
53.在一个实施例中,步骤s100之后,方法还包括:
54.对所述训练样本集进行样本预处理和样本扩量处理。
55.本实施例中,由于用户提供的现有店铺可能样本数量较少,且位置信息描述不统一,为提高后续模型训练的准确性以及样本的丰富程度,先对训练样本集进行样本预处理以及样本扩量处理,以符合模型训练的需求。
56.在一个实施例中,所述对所述训练样本集进行样本预处理和样本扩量处理,包括:
57.将所述训练样本集中的位置数据转换为经纬度数据;
58.根据所述店铺数据,对所述训练样本集进行正样本扩量处理;
59.根据所述店铺数据和经纬度数据,对所述训练样本集进行负样本扩量处理。
60.本实施例中,用户提供的已有店铺信息一般仅包含省、市、区、详细地址等文本形式的地址信息作为位置数据,为提高信息识别效率,需要首先将位置数据转化为数字化的经纬度数据,便于后续处理,之后个分布对训练样本集进行正样本扩量处理和负样本扩量处理,以生成更多的训练样本,其中正样本扩量处理为根据现有代纳普的店铺数据,包括店铺类型、品牌类型等,寻相似品牌、相似类别的店铺。例如,用户是某咖啡连锁品牌a,则可使用咖啡品牌b的店铺数据,作为正样本进行扩量。
61.针对负样本扩量处理则通过geohash辨别方式生成,在一个实施例中,所述根据所述店铺数据和经纬度数据,对所述训练样本集进行负样本扩量处理,包括:
62.根据所述店铺数据,获取相应品牌的门店分布比例高于预设比例的城市并调取所述城市的geohash数据;
63.对所述城市的geohash数据进行过滤,筛选得到业态分布指标大于预设指标的目标区域;
64.根据所述经纬度数据将所述现有店铺的geohash数据插入至所述目标区域的geohash数据中,将所述目标区域划分为有品牌门店区域和无品牌门店区域;
65.在所述无品牌门店区域中确认业态分布信息与所述有品牌门店区域相似的区域作为负样本,对所述训练样本集进行负样本扩量处理。
66.本实施例中,通过geohash辨别方式生成负样本,geohash是空间索引的一种方式,其基本原理是将地球理解为一个二维平面,通过把二维的空间经纬度数据编码为一个字符串,可以把平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码,以geohash方式建立空间索引,可以提高对空间poi(point of interesting,兴趣点)数据进行经纬度检索的效率。
67.在进行负样本扩量时,基于店铺数据中的品牌信息,先获取品牌门店分布最集中(例如分布比例前三或者分布比例大于预设比例)的城市,调取城市的geohash数据,之后筛选城市中有商业活动的目标区域,具体是对城市的geohash数据进行过滤,筛选geohash中餐饮和零售的poi数量大于5的目标区域,根据现有店铺的经纬度数据将门店数据插入至目标区域的geohash数据中,进而将商业活动的目标区域划分为有品牌门店和无匹配门店的两种区域,基于两种区域的业态分布信息,即门店周边的业态类型与数量等,在无品牌门口区域中选择业态分布信息与有匹配区域相似的区域作为负样本,完成负样本的自动生成,以丰富训练样本,提高模型训练的准确性。
68.s200、根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类。
69.本实施例中,训练时通过分析现有店铺的营业数据,采用现有店铺周围的业态分
布情况作为分析维度,例如分析维度包括餐饮和零售两大类poi的所有三级分类,由于poi三级分类数量较多,即可分析维度较多,若所有维度均参与模型训练造成模型的不稳定,所以在模型训练之前,需要对参与训练的关键分析维度进行选择,寻出影响店铺营业数据的关键分析维度。并且还根据不同现有店铺的业态分布信息将店铺分成不同类别,便于后续针对每个类别中的登录进行单独分析,以提高模型的训练效率和可靠性。
70.在一个实施例中,步骤s200包括:
71.根据所述训练样本集中每个现有店铺的业态分布信息,计算每个分析维度的iv值;
72.将所述iv值处于预设范围的分析维度确认为关键分析维度;
73.根据所述训练样本集中每个现有店铺的业态分布信息,通过降维分类算法将所述训练样本集中的现有店铺划分为若干个样本类别,每个样本类别具有相似的业态分布特征。
74.本实施例中,通过iv值即信息价值(information value)来表征各个分析维度的预测能力,具体基于店铺的业态分布信息,即参与和零售两大类poi的所有三级分类均作为分析维度,计算每个分析维度的iv值,具体的计算过程为:
75.首先计算woe参数,计算公式为其中,p
yi
是第i组中响应客户占所有响应客户的比例(响应客户指模型中预测变量即分析维度取值为“是”或者为“1”的个体),p
ni
是第i组中未响应客户占所有未响应客户的比例,yi是第i组中响应客户的数量,ni是第i组中未响应客户的数量,y
t
是样本中所有响应客户的数量,n
t
是样本中所有未响应客户的数量。
76.iv值的计算基于woe参数,可以看成是对woe参数的加权求和,对于一个分组后的变量,第i组的woe如公式上所示,同样对于第i组也会有一个对应的iv值,计算公式为iv值在woe的基础上保证了结果非负,根据变量在各分组上的iv值,可得到整个变量的iv值为其中n为变量分组个数。
77.计算得到iv值后,基于iv值的大小选择相应进入模型训练的预测变量即关键分析维度,具体选择iv值大于0.02且小于0.5的关键分析维度,以提高模型训练的可靠性。
78.同时,本实施例中针对训练样本集中的每个现有店铺,通过获取其周边范围内的业态分布信息,包括不同业态集配套分类以及相应的数量即poi数量,例如a周边500米范围内,有学校2个、火锅店5家、冷饮店12家等等,如表1所示:
79.表1
[0080][0081][0082]
通过降维分类算法将现有店铺分成不同的样本类别,且每个样本类别具有相似的业态分布特征,具体来说,降维分类是一种投影降维法,它可以自动的判断不同维度的重要程度以及正负相关性,最终将多维的“店铺数量”降低为二维数据,而二维数量则可在平面上展示,方便观测降维训练的有效性。降维分类法使用的是投影降维法,多维的特征被不断投影最终生成二维数据,这个过程中,会根据每个维度的重要程度,确定投影方向,使得重要维度保留较长的投影,非重要维度保留较短的投影。最后的二维数据,可以直观的判断分类的有效性,同种类型的点大多分布的较近,在差异较大的类之间,还是存在区域界限,因此可以通过降维分类对训练样本的店铺进行分类,例如一个预测样本的落点周边都是a类型,或者a类型的概率最高,或者与某个a类型训练样本最为接近,那么大概率可以认为该预测样本为a类型。基于业态分布信息将训练样本集中的现有店铺分类若干个样本类别,后续则针对不同的类型单独进行分析,使得可以满足不同业态与配套情况的店铺选址的营业数据分析,提高营业数据分析的准确性。
[0083]
s300、根据所述训练样本集中每个样本类别中的店铺信息以及所述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型。
[0084]
本实施例中,在进行店铺分类后,则针对每个样本分类中的店铺信息以及关键分析维度的分布数据即poi数据,对预设模型进行拟合训练,以得到每个样本类别下的营业分析模型,即不同类别的营业分析模型是不相同的,具体的营业分析模型是作为自变量的关键分析维度与作为因变量的营业数据之间的函数关系,以实现对未来店铺选址的准确营业数据分析预测。
[0085]
在一个实施例中,步骤s300包括:
[0086]
将每个样本类别的店铺信息以及所述关键分析维度的分布数据分别输入至多元回归模型中,进行模型拟合训练;
[0087]
在达到预设拟合条件时结束模型训练,输出每个样本类别下每个关键分析维度的权重系数以及整体偏移量,生成每个样本类别下的营业分析模型。
[0088]
本实施例中,具体的预设模型采用多元回归模型,将每个样本类别的店铺信息以
及所述关键分析维度的分布数据输入到多元回归模型中,对每个分类的样本进行模型拟合训练,优选地,本实施例的营业数据采用营业额等级,且采用多元逻辑回归进行模型训练,相比于线性回归,逻辑回归的稳定性更强,且店铺的月营业额是波动的,使用营业额等级会更加准确,使用营业额等级作为多元逻辑回归的分类进行模型训练,拟合训练过程为以关键分析维度的分布数据即poi数据作为自变量、营业额等级作为因变量完成因果关系的训练,在达到预设拟合条件是则结束模型训练,例如拟合优度大于预设值或者训练次数大于预设次数等等,由于提前对训练样本进行了分类,每个分类下的店铺数据具有相似性,相似样本的拟合训练模型将变得简单,且命中率都较高,有效提高训练效率和准确性,训练完成后则会输出每个样本类别下每个关键分析维度的权重系数以及整体偏移量,进而生成每个样本类别下的营业分析模型,即针对每个样本类别,均得到了关键分析维度与营业数据之间的函数关系以作为营业数据分析的可靠模型基础。
[0089]
s400、获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别。
[0090]
在需要针对未来店址的营业数据进行分析预测时,则获取待分析的目标位置,即目标开店地址,根据目标开店地址周围的业态分布信息先进行分类,确认其所属的目标类别,即在预测分析时先确认目标位置周围环境与训练样本之间最符合的类别,以寻最合适的营业分析模型,尽可能提高营业数据分析的可靠性。
[0091]
在一个实施例中,步骤s400包括:
[0092]
获取待分析的目标位置;
[0093]
根据所述目标位置的业态分布信息与每个样本分类的业态分布特征进行匹配,输出与每个样本分类的匹配概率;
[0094]
将匹配概率最高的样本分类作为所述目标位置的目标类别。
[0095]
本实施例中,基于目标开店地址周边的业态分布信息与样本分类时每个类别的业态分布特征进行匹配,得到与每个样本分类的匹配概率,即与训练样本之间的相似程度,将匹配概率最高的样本分类作为当前目标位置的目标类别,即当前目标位置周边的业态与配套情况,与目标类别中的现有店铺最为相似,通过该目标类别训练得到的营业分析模型对目标位置进行营业数据分析,结果更加可靠。
[0096]
s500、将所述目标位置输入至所述目标类别对应的营业分析模型中,输出相应的营业数据分析结果。
[0097]
本实施例中,在确认了目标类别后,则调取其对应的已经训练完成的营业分析模型,即关键分析维度与营业数据之间的函数关系,将目标位置输入至模型中,根据目标位置的业态分布信息获取到关键分析维度的分布数据即可高效输出对目标位置的营业数据分析结果,实现准确且高效的营业数据预测。
[0098]
本发明另一实施例提供一种基于模型的店铺营业数据分析装置,如图2所示,装置1包括:
[0099]
样本采集模块11,用于采集现有店铺的店铺信息并构建训练样本集,其中,所述店铺信息包括店铺数据、位置数据和营业数据;
[0100]
样本处理与分类模块12,用于根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类;
[0101]
模型训练模块13,用于根据所述训练样本集中每个样本类别中的店铺信息以及所
述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型;
[0102]
目标分类模块14,用于获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别;
[0103]
分析模块15,用于将所述目标位置输入至所述目标类别对应的营业分析模型中,输出相应的营业数据分析结果。
[0104]
本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述基于模型的店铺营业数据分析的执行过程,各模块的具体实施方式请参考上述对应的方法实施例,此处不再赘述。
[0105]
本发明另一实施例提供一种基于模型的店铺营业数据分析系统,如图3所示,系统10包括:
[0106]
一个或多个处理器110以及存储器120,图3中以一个处理器110为例进行介绍,处理器110和存储器120可以通过总线或者其他方式连接,图3中以通过总线连接为例。
[0107]
处理器110用于完成系统10的各种控制逻辑,其可以为通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)、单片机、arm(acorn risc machine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。还有,处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合,例如,dsp和微处理器的组合、多个微处理器、一个或多个微处理器结合dsp和/或任何其它这种配置。
[0108]
存储器120作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的基于模型的店铺营业数据分析方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元,从而执行系统10的各种功能应用以及数据处理,即实现上述方法实施例中的基于模型的店铺营业数据分析方法。
[0109]
存储器120可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据系统10使用所创建的数据等。此外,存储器120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至系统10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0110]
一个或者多个单元存储在存储器120中,当被一个或者多个处理器110执行时,执行上述任意方法实施例中的基于模型的店铺营业数据分析方法,例如,执行以上描述的图1中的方法步骤s100至步骤s500。
[0111]
本发明实施例提供了一种非易失性计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如,执行以上描述的图1中的方法步骤s100至步骤s500。
[0112]
作为示例,非易失性存储介质能够包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦rom(eeprom)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(ram)。通过说明而非限制,ram可以以诸如同步ram(sram)、
动态ram、(dram)、同步dram(sdram)、双数据速率sdram(ddrsdram)、增强型sdram(esdram)、synchlink dram(sldram)以及直接rambus(兰巴斯)ram(drram)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器组件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。
[0113]
综上,本发明公开的基于模型的店铺营业数据分析方法、装置、系统及介质中,方法通过采集现有店铺的店铺信息并构建训练样本集;根据每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对训练样本集中的现有店铺进行样本分类;根据每个样本类别中的店铺信息以及关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型;获取待分析的目标位置,确认目标类别;将目标位置输入至目标类别对应的营业分析模型中,输出营业数据分析结果。通过采集现有店铺的信息,基于关键分析维度对不同业态分布特点的同类店铺进行营业分析模型的训练,使模型能基于任意目标位置输出营业数据分析结果,提高店铺营业分析的效率和准确性。
[0114]
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的计算机程序可存储于一非易失性计算机可读取的存储介质中,该计算机程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、软盘、闪存、光存储器等。
[0115]
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

技术特征:


1.一种基于模型的店铺营业数据分析方法,其特征在于,包括:采集现有店铺的店铺信息并构建训练样本集,其中,所述店铺信息包括店铺数据、位置数据和营业数据;根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类;根据所述训练样本集中每个样本类别中的店铺信息以及所述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型;获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别;将所述目标位置输入至所述目标类别对应的营业分析模型中,输出相应的营业数据分析结果。2.根据权利要求1所述的基于模型的店铺营业数据分析方法,其特征在于,所述采集现有店铺的店铺数据并构建训练样本集之后,所述方法还包括:对所述训练样本集进行样本预处理和样本扩量处理。3.根据权利要求2所述的基于模型的店铺营业数据分析方法,其特征在于,所述对所述训练样本集进行样本预处理和样本扩量处理,包括:将所述训练样本集中的位置数据转换为经纬度数据;根据所述店铺数据,对所述训练样本集进行正样本扩量处理;根据所述店铺数据和经纬度数据,对所述训练样本集进行负样本扩量处理。4.根据权利要求3所述的基于模型的店铺营业数据分析方法,其特征在于,所述根据所述店铺数据和经纬度数据,对所述训练样本集进行负样本扩量处理,包括:根据所述店铺数据,获取相应品牌的门店分布比例高于预设比例的城市并调取所述城市的geohash数据;对所述城市的geohash数据进行过滤,筛选得到业态分布指标大于预设指标的目标区域;根据所述经纬度数据将所述现有店铺的geohash数据插入至所述目标区域的geohash数据中,将所述目标区域划分为有品牌门店区域和无品牌门店区域;在所述无品牌门店区域中确认业态分布信息与所述有品牌门店区域相似的区域作为负样本,对所述训练样本集进行负样本扩量处理。5.根据权利要求1所述的基于模型的店铺营业数据分析方法,其特征在于,所述根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类,包括:根据所述训练样本集中每个现有店铺的业态分布信息,计算每个分析维度的iv值;将所述iv值处于预设范围的分析维度确认为关键分析维度;根据所述训练样本集中每个现有店铺的业态分布信息,通过降维分类算法将所述训练样本集中的现有店铺划分为若干个样本类别,每个样本类别具有相似的业态分布特征。6.根据权利要求1所述的基于模型的店铺营业数据分析方法,其特征在于,所述根据所述训练样本集中每个样本类别中的店铺信息以及所述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型,包括:将每个样本类别的店铺信息以及所述关键分析维度的分布数据分别输入至多元回归
模型中,进行模型拟合训练;在达到预设拟合条件时结束模型训练,输出每个样本类别下每个关键分析维度的权重系数以及整体偏移量,生成每个样本类别下的营业分析模型。7.根据权利要求5所述的基于模型的店铺营业数据分析方法,其特征在于,所述获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别,包括:获取待分析的目标位置;根据所述目标位置的业态分布信息与每个样本分类的业态分布特征进行匹配,输出与每个样本分类的匹配概率;将匹配概率最高的样本分类作为所述目标位置的目标类别。8.一种基于模型的店铺营业数据分析装置,其特征在于,包括:样本采集模块,用于采集现有店铺的店铺信息并构建训练样本集,其中,所述店铺信息包括店铺数据、位置数据和营业数据;样本处理与分类模块,用于根据所述训练样本集中每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对所述训练样本集中的现有店铺进行样本分类;模型训练模块,用于根据所述训练样本集中每个样本类别中的店铺信息以及所述关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型;目标分类模块,用于获取待分析的目标位置,根据所述目标位置的业态分布信息确认目标类别;分析模块,用于将所述目标位置输入至所述目标类别对应的营业分析模型中,输出相应的营业数据分析结果。9.一种基于模型的店铺营业数据分析系统,其特征在于,所述系统包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任一项所述的基于模型的店铺营业数据分析方法。10.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-7任一项所述的基于模型的店铺营业数据分析方法。

技术总结


本发明公开了基于模型的店铺营业数据分析方法、装置、系统及介质,包括:采集现有店铺的店铺信息并构建训练样本集;根据每个现有店铺的业态分布信息确认符合预设条件的关键分析维度,并对训练样本集中的现有店铺进行样本分类;根据每个样本类别中的店铺信息以及关键分析维度的分布数据,对预设模型进行拟合训练,得到每个样本类别下的营业分析模型;获取待分析的目标位置,确认目标类别;将目标位置输入至目标类别对应的营业分析模型中,输出营业数据分析结果。通过采集现有店铺的信息,基于关键分析维度对不同业态分布特点的同类店铺进行营业分析模型的训练,使模型能基于任意目标位置输出营业数据分析结果,提高店铺营业分析的效率和准确性。分析的效率和准确性。分析的效率和准确性。


技术研发人员:

黄兴丽 姜辉 黄兴鲁 林超

受保护的技术使用者:

深圳数位大数据科技有限公司

技术研发日:

2022.09.16

技术公布日:

2022/12/9

本文发布于:2024-09-20 13:43:52,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/4/34837.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:样本   所述   店铺   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议