基于模型融合的网络用户数据预测优化

信息科学
科技创新导报 Science and Technology Innovation Herald
jgdy115
①作者简介:任金虎(1998,2—),男,山东济宁人,本科在读,研究方向:网络工程。
DOI:10.16660/jki.1674-098X.2019.36.115
基于模型融合的网络用户数据预测优化
任金虎  李亚楠  王艳玲
(山东科技大学  山东泰安  271000)
摘  要:目前互联网软件的功能调整和改进方案主要以用户的行为习惯为依据进行调整。为了高效利用现
有用户数据进行用户行为、用户倾向等分析与预测,本文通过对包括多种用户在线行为的数据进行分析。首先对用户倾向评估产生较大影响的属性值进行权值分析,将已有的特征值综合整合后生成全面的用户行为数据;再对行为数据中的同类行为进行细化分级,强化行为指向。通过使用模型融合的方法针对单模型进行优化和处理,进一步提高预测准确率。关键词:模型融合  滑窗法  XGBoost  BI-LSTM 中图分类号:TN915.04                            文献标识码:A                        文章编号:1674-098X(2019)12(c)-0115-02
如何建立新的运营处理模式、有效利用现有数据制定合适的营销机制、改进和调整软件的功能,达到吸引目标用户、保持用户粘度的目的,将是每个互联网企业在大数据时代的核心问题。而对“活跃用户”(将会在未来一段时间内登录软件的用户)的行为数据进行有效分析和预测是软件功能改进和企业服务质量提升的重要途径之一。
本文以短视频APP的用户数据为例进行分析与预测,以前30d的用户数据作为数据集,以后7d登录的用户id作为测试集,以XGBoost模型、LGB模型和BI-LSTM模型作为子模型进行模型融合建立综合预测模型,预测将会在未来7天内登录的“活跃用户”。在进行用户数据的分析过程中,由于行为分类较为复杂,需将行为因素分级考虑。一方面对于主动动作用户(主动发起点赞、转发、拉黑等动作的用户)自身,针对连续较长时间活动的用户进行筛选并增加其优先级。另一方面对于被动动作用户(被动接受上述动作的用户),针对不同分类的动作进行分类处理。
1  模型融合技术简介电子元件与材料
钾盐矿模型融合( Model Ensemble )是一种通过构建并融合多个模型来完成学习任务,从而提高机器学习效率的方法。
图1是一种常见的模型融合结构。其主要包含两个阶段:构建若干单模型( Single Model)和模型融合。单模型通常是由基本的学习算法在训练集上学习得到的,它们可以是决策树、神经网络或者其他类型的学习算法。
在单模型多样性较大情况下,尝试模型融合极有可能取得显著的效果提升。因此,选择一些单模型特征与多个单模型融合在一起进行训练,融合模型的泛化能力在某些场景下效果会更好。但应注意,线上系统对预测或分类服务的响应速度通常要求较高,线上特征获取和模型预测会消耗一定时间,而多阶模型融合只能以串行的方式来运算。因此,在线上系统使用模型融合要谨慎。
2  单模型建立与处理
2.1 数据分析与处理
2.1.1 用户数据说明主要数据集信息如下:
注册日志(user_):包括用户注册时的基础信息。
APP启动日志(app_ ):包括前30天内用户登录的精确时间。蔡澜食材字典
拍摄行为日志(video_):包括用户使用APP拍摄功能的日期等。
用户行为日志(user_):包括用户的点赞、转发等各种行为记录。
2.1.2 滑窗法划分数据集
使用滑窗法来构造样本格式,不仅能给数据赋予标签值,同时还可以划分多个训练测试集用以完善模型。针对数据量较小的情况,通过滑动窗口增加样本数量,可覆盖更多数据,提高模型学习效率。测绘通报
2.1.3 特征提取
科技创新导报
若仅用表中所给的数据作为目标值进行预测,结果准确率有限。因此需要在四个表中分别提取特征、添加目标值。在拍摄行为日志中,对其次数进行统计并将创建视频相隔的天数的均值,方差,峰度等提取作为新的七个特征;在启动日志和用户行为日志中,在page列里统计0 1 2 3 4的个数并且统计其占总个数的频次,以该方式提取100余个特征。
由于注册方式来源、登录拍摄与行为次数值极值相差过大或数据过于离散,此时采用归一化的方法对数据集进行处理更有利于分类和预测。
2.2 两个基于GBDT的模型实现——以XGBoost为例
在数据集中,不同的用户的行为是不一样的,在此选取其中的多个维度、多种特征,可通过 GBDT综合分析它们对用户活跃度结果产生的影响。其改进后的XGBoost模型可在相对短的时间内对大型数据源做出良好的效果;而LGB模型因其更快的训练效率、更低的内存使用、更高的准确率等优势,更适用于处理较大规模数据。在此以XGBoost模型的处理过程为例。

本文发布于:2024-09-21 19:54:49,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/725969.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:用户   模型   数据   进行   行为   融合
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议