权重计算方法_电商商品搜索权重模型

权重计算⽅法_电商商品搜索权重模型
编辑导语:我们在⽹上搜索商品时,它会根据季节、销量等⼀些数据进⾏排列;⽐如我们在夏天的时候搜索长袖,只会出现⽐较薄款的类型,厚重的长袖都在后⾯;本⽂作者对电商商品搜索权重模型进⾏分析,我们⼀起来看⼀下。
商品搜索权重设计做为各⼤电商的商业机密,⽹上很少有资料涉及这⽅⾯的知识;之前因为项⽬需要,⾃⼰整理过⼀些权重设计资料,这⾥和⼤家分享⼀个简单的权重计算模型,有兴趣的朋友可以⾃⼰再根据需求进⾏优化。
2009nba全明星赛⼀、权重概念
权重是反应参数指标在整体评价系统中的重要程度,权重越⾼,表明该指标越重要。
举个列⼦,⼀个学校招⽣考试,共三个科⽬:语⽂(100分)、数学(100分)、英语(100分),最终根据语⽂30%,数学40%,英语30%的⽐例进⾏累计得⼀个总得分,得分⾼者优先录取。
其中的百分⽐就是各科的权重,数学占⽐40%,则说明学校对学⽣的数学更加重视。
权重的计算⽅法有很多中,如:加权计算法、加权平均数法、AHP层次法、优序图法等等,今天我们通过最简单的加权计算法来实现⼀个商品的权重模型,对其它权重算法感兴趣的朋友可以⾃⼰搜索学习。
⼆、加权法
什么是加权法呢?
还是上⾯的例⼦,如果有个考⽣的成绩如下:语⽂(85)、数学(90)、英语(80),那么他的加权计算过程为:85*30% + 90*40% +
80*30% = 85.5——就是简单的【成绩 * ⽐例】 再累加的过程。
把上⾯的科⽬映射到商品中,则有如下关系:
科⽬ = 商品属性
h2o2分值 = 属性分值
成绩 = 属性得分
王驹
占⽐ = 属性的权
这都是什么意思呢?下⾯我们来⼀⼀说明。
1. 确定权重指标【科⽬=商品属性】
权重指标这个⽐较好理解,前⾯我们讲的标题、品类、品牌等等都属于商品属性。
需要注意的是在权重模型中,并不是商品的所有属性都会参与权重计算的,影响⽤户搜索习惯、以及销量的属性才会参与计算。
如:品牌、价格、总销量、⽉销量、浏览量、收藏量、商品评分等;对于不同的品类,部分特有属性也会参与计算,如:服饰品类的材质、适应季节等,⼿机品类的内存⼤⼩、存储⼤⼩等。
2. 定义指标满分值【分值=属性分值】
指标满分值就好⽐给科⽬定义的满分值⼀样,只有设置了上限,数据才有对⽐性,我们才能判断出⼀个具体的分值所代表的好坏程度。
在商品属性中,部分属性在系统设计之初就已经有分值的定义,如评分,通常都设置为10分制或者5颗星的记分⽅式。
但是在这⾥依然需要给他们再重新定义⼀套权重中的满分值,⽽不能使⽤原始的10分制或5颗星来计算,因为后⾯涉及到了⾃定义权重的⾼低,需要动态进⾏调整。
还有⼀个需要注意的地⽅,满分值的定义需要根据属性值的多少来作为依据;如平台有500个独⽴的品牌,那么品牌的满分值就不应该定义为100,⽽是1000;否则就会出现扎堆现象,某个分值会出现多个品牌的情况,应该尽量避免这种情况发⽣。
3. 划分指标分值【成绩=属性得分】
对于科⽬来说,卷⾯分已经规定好了,具体能考出多少成绩,这个就得看各位同学⾃⼰的发挥了。
商品也⼀样,属性的满分定义好后,某个具体属性能得多少分值就需要根据统计数据和评分标准进⾏打分。联想昭阳e360
⾸先需要定制评分标准,标准的规定有两种⽅式:
1. ⼈⼯经验定义:根据后台的销售数据⼈为的决定分值,搜索⽐较多的,销售量⾼的可以得分⾼点,反之亦然;如⼿机品类中的品牌,
通常⽐较⽕热的就是华为、苹果、⼩⽶,其次vivo、oppo、三星等等,⼈为的依次可以为它们设置得分值:华为(500)、苹果(450)、⼩⽶(400)、vivo(380)、oppo(350)、三星(320)。
2. 有明确数据参考:根据系统反馈的统计数据,通过计算获得分值;如⽉销量,默认满分定义为1000分,如果⽉销量超过5000单,则
得1000分,未超过的根据⽐例计算动态获得的分值。
4. 确定指标的权【占⽐ = 属性权】
与各科的占⽐⼀样,权重模型需要为每个参与计算的属性设置相应的权,这⾥之所以没有叫占⽐,是因为通常我们理解的占⽐是以百分制来计算的,所有参与因素占⽐最终加起来需要等于百分百。
但是商品模型参数属性⽐较多,采⽤百分制会试最终的权重值很聚集,搜索效果并不好。
所以通常采⽤权的设计⽅法。什么是权呢?
举个实例,如:数字8692 = 8* 1000 + 6*100 + 9*10 + 2*1,其中千分位的权是1000,百分位的权是100,⼗分位的权是10,个位的权是1。
我们采⽤类似的⽅式给参与权重的商品属性定义权,如⽐较重要的属性:品牌(100000)、价格(100000)、总销量(10000)、⽉销量(10000);重要的属性:浏览量(1000)、收藏量(1000);⼀般的属性:库存(10)、材质(10);其中不同的属性是可以定义相同权的。
理解了以上⼏点,权重模型的基本框架就设计好了,最终权重值通过累加分值乘以权就可以得到。
三、优化
煤矿供电设计
1. 品类影响
在上述的权重模型中,受品类的影响⽐较严重。
⽐如⼩⽶品牌下有多款不同品类的商品,假如有⼿机和电视两个品类,⼤家对他的⼿机认可度⽐较⾼,所以⼿机品类下品牌的得分和权相对就会设置的⽐较⾼⼀些;⽽电视是刚进⼊市场,⼤家对他的接受度与⽼牌⼚商⽐就略显逊⾊,所以电视品类下品牌的得分和权就应该设置的低⼀些。
再有⼀个原因就是如果有品类的特殊属性要参与权重,不同品类的特殊属性是不同的。所以在维护权重模型的基本配置时,应该是以品类为单位去维护,这样才能做到个性化的权重设计。
2. ⼈⼯⼲预
上⾯通过设置好权重配置后,内部都是通过代码逻辑计算获得的权重值。
但是如果平台需要推⼴新品,由于新品没有销售数据,所以它的排名默认肯定都靠后;这时就需要设计⼀个维护⼊⼝,通过⼈⼯单独为商品增加权重数值,将新品排名提到前⾯已达到推⼴⽬的。
3. 外界因素影响
激光陀螺对于部分商品的个别属性,它的权重值会受⼀些外部因素的影响。
如服饰和鞋类,它们材质属性受季节的影响;如材质分别为棉绒和涤纶的登⼭鞋,夏天搜索【登⼭鞋】这个关键字时,涤纶材质的应该被排在前⾯,棉绒材质的应该被排在后⾯;冬天搜索【登⼭鞋】时,棉绒材质的应该在前,涤纶材质的应该在后,这个在做计算时应该是有依赖条件的。
以上就是加权权重模型的设计⽅案,希望对你有帮助。
这⾥再多说⼀下,为了能够保证商品权重的及时性,⽣产环境下通常每天晚上都会对商品重新做权重值计算。
最后给出⼀个商品的模拟⽰例,有需要的同学根据⾃⼰的场景优化⼀下。
作者:JackLiu;个⼈: 扬帆去远航(ID:Jackai_liu)
本⽂由 @Jack 原创发布于⼈⼈都是产品经理,未经作者许可,禁⽌转载。
题图来⾃Unsplash,基于CC0协议。

本文发布于:2024-09-22 07:02:34,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/483893.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:权重   属性   商品
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议