基于Python的企业员工舆情分析

梁山清李恩宁王学萍李博葛红志中电科卫星导航运营服务有限公司
通过Python软件,分析企业员工的舆情态势。对原始数据进行预处理并制作静态画像。通过TF-IDF算法,进行热词分析、词云分析;运用SnowNLP算法对舆情数据进行情感彩分析和关键词情感指数分析;基于LDA模型进行文本主题分析。以上分析方法可辅助企业管理者对员工进行更精准的日常管理和企业文化引导。
伴随数字信息时代的快速发展,企业越来越重视员工的舆情态势。对于企业而言,负面的舆论信息会损害企业品牌形象,重挫企业业务,进而造成重大的经济损失。因此,有计划地收集和分析企业员工的舆论信息,分析舆情走向,采取舆论应对措施,对企业的改进和发展有着非常重要的作用。
员工静态画像
本文采用企业每年收集的员工年终总结Excel文本,文本中主要包括编号、性别、年龄、学历、学位、入职时间、职务、职称、婚否、所属部门、年度感受、最感谢的人、最满意的事、新年目标、对企业的建议等字段。将以上数据进行脱敏和预处理后,再运用Python进行数据分析。
员工静态画像主要对员工的基本信息进行整体分析,具体包括员工总数、男女比例、婚姻比例、学位分
布、职称分布、岗位分布、年龄分布等信息。其中,学历分布指员工中学位为博士、硕士、学士以及其他的占比分布,岗位分布指员工中从事研发、工程、市场、研发辅助的人数比例,年龄分布指员工中60后、70后、80后、90后的人员构成。
基于TF-IDF的年度热词分析
TF-IDF的全称是Term Frequency-inverse document frequency,由词频(Term Frequency,TF)和逆文档频率两部分组成。TF是指某个词语在文本中出现的频率;IDF则反映关键词的普遍程度,当一个词语在文本中越普遍存在时,其IDF值越低;反之,则IDF值越高。TF、IDF和TF-IDF的公式如下:TF=某个词在文章中的出现次数/该文章所有词的数量(1)
IDF=log(语料库的文档总数/包含该词的文本数+1)(2)TF-IDF=TF*IDF(3)
词语的TF-IDF值越大,表示该词语在文本中的重要性越高。本文通过计算员工年度总结文本中的词语重要性,形成年度热词排行榜,辅助企业管理人员了解企业舆情动向。
词云分析
企业员工的文本主要包括年度感受、最满意的事、新年目标、对公司建议这4个总结项。通过Python程序对以上文本分别进行切词并删除停用词,利用处理后的文本为每个总结项生成词云。
根据词云分析,可以得出企业员工在以上各总结项上的具体舆情态势。
基于SnowNLP的情感彩分析
SnowNLP是用Python写的个中文情感分析的类库,自带中文正负情感的训练集,主要是评论的语料库。使用的是朴素贝叶斯原理来训练和预测数据。
通过分析文本中每个总结项语句的感情彩(积极、中立、消极)进行分析,比如,包含“技术和能力都得到极大的提升”的语句感情彩积极,包含“为人处世上依然初心不改”的语句感情彩中立,包含“材料整理工作让人头疼”的语句感情彩消极。
情感彩分析有助于了解员工的整体情感态势,辅助公司进行工作氛围引导、公司文化建设、规章制度制定。
关键词情感指数分析
通过选取TF-IDF值很高或者特定词语作为关键词,对包含关键词的所有语句进行情感指数计算,分析员工对关键词的整体态度,辅助管理者准确掌握公司舆情方向。
基于LDA模型的主题分析
潜在狄利克雷分布(Latent Dirichlet Allocation,LDA),是一种文档生成模型,属于非监督机器学习技术。它可以将待分析文本的主题以概率分布的形式给出,并根据主题分布进行主题聚类或文本分类。
进行LDA主题分析前,需要预估文本的主题数量,预估文本主题包含5个。通过分析文本主题词汇,企业管理者可以从宏观角度把握员工关注的主题,并制定精准的企业管理制度。
结果分析
1.年度热词结果分析
通过TF-IDF主
题词分析算法,计算年度主题词Top20,具体结果如表1所示。
摄像机三脚架
表1年度主题词Top20
总结项词云结果分析年度感受
年度感受词云如图1所示。
图1年度感受词云
经分析,年度感受总结项主要聚焦于“工作、成长、学习、技术、充实、家庭、能力、疫情、投标、责任”等词汇。
最满意的事
最满意的事词云如图2所示。
图2满意的事词云
经分析,员工最满意的事情主要是关于顺利完成“开发、验收、设计、投标、开发、交付”公司任务方面,也有很多同事对自己在“学习、技术、调试”等能力提升上取得的进步很欣喜。
新年目标
新年目标词云如图3所示。
设备防尘罩图3新年目标词云
经分析,大家的新年目标要聚焦于提升“技术、能力、知识”,做好和设计好“系统、产品、芯片、终端”,促进“业务落地”,加快“生产”等方面。
对公司建议
对公司建议词云如图4所示。
图4对公司建议词云
经分析,大家对公司的建议主要聚焦于“交流、培训”“管理、流程”“产品”“规划、发展方向”
等方面。情感彩结果分析医用压片机
员工情感彩分析结果如表2所示。
表2情感彩分析表
经分析,87%的文本感情表达积极,13%的文本表达包含消极成分。
关键词情感指数分析
关键词情感指数分析结果见如表3所示。扎带
视频显示器表3关键词情感指数分析表
经分析,所有员工对“成长”和“学习”具备最高程度的认可;面对“疫情”,大家斗志依然高昂;大家在表达“工作”“同事”“技术”“项目”等主题时,也都保持了很高的积极性。
文本主题结果分析
基于LDA 模型的主题分析结果如表4所示。
表4基于LDA 模型的主题分析表
本文运用Python 工具,运用TF-IDF 、SnowNLP 、LDA 模型
等机器学习算法,对企业员工的舆情文本数据整体热度、感情彩、主题以及分项词云进行分析,挖掘企业员工舆情态势。本文所做的工作对于企业管理
进行
准管理
和企业文化引导具有一定的实用价值和借鉴意义。bbzs

本文发布于:2024-09-23 13:14:35,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/244968.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分析   员工   企业   文本   进行   主题
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议