Python——租房信息数据分析

Python——租房信息数据分析
租房信息数据分析
孝陵卫1 题⽬:租房信息数据分析
“data”⽂件夹中有⼀⽂件“house_info.csv”保存了租房信息数据,以该⽂件作为数据源,按以下要求进⾏分析:
1. 导⼊数据并对数据进⾏预处理;
2. 分析各⾏政区的房源分布情况,选择合适的图表对各⾏政区的房源分布情况进⾏可视化,并总结分析结果;
3. 以⼩区为单位,分析各⼩区的房源数量,选择合适的图表对⼩区房源数量TOP10进⾏可视化,并总结分析结果;
4. 对整个租房数据的户型进⾏分析,统计户型TOP10,并选择合适的图表进⾏可视化,并总结分析结果;
5. 分析租房数据的租⾦分布情况,选择合适的图表进⾏可视化,并总结分析结果。
2. 导⼊数据
import pandas as pd
import numpy as np
detail = pd.read_csv(r".\house_info.csv", encoding="utf-8")
# print(detail.head())
print("清洗前缺失值的数⽬:\n",detail.isnull().sum())
# 删除detail的缺失值
d1 = detail.dropna(axis=0, how="any")# 以d1 为数据源
# print(d1)
print("清洗后缺失值的数⽬:\n",d1.isnull().sum())
# 从前向后查和判断是否有重复值
print("重复值:",d1.duplicated().sum())
3. 各⾏政区房源分布
crpd-366选⽤合适的图表,以⾏政区为单位,对⽐分析各⾏政区房源数量分布情况,并对可视化结果进⾏简单的总结。
area =set(d1["位置1"])# 统计多少个⾏政区
print(area)
# 创建⼀个DataFrame 对象,筛选需要数据{⾏政区,房源数量}
d2 = pd.DataFrame({'⾏政区':d1["位置1"].unique(),'房源数量':[0]*len(area)}) print(d2)
print('-'*20)
# groupby统计房源数量,并从⼩到⼤排序
groupby_area = d1.groupby(by="位置1").count()
print(groupby_area)
d2["房源数量"]= groupby_area.values
d2 = d2.sort_values(by=["房源数量"],ascending=True)
print(d2)
非接触测量
# 绘图
import matplotlib.pyplot as plt
import matplotlib
X = d2["⾏政区"]
print(X)举宫
Y = d2["房源数量"]
print(Y)
plt.figure(figsize=(8,6),dpi=300)
plt.bar(X, Y, width=0.5, linewidth=2)
for i,j in zip(X, Y):
<(i, j,"%d"% j, fontsize=16)
plt.xlabel("⾏政区")
plt.ylabel("房源数量")
plt.title("各⾏政区房源分布图")
plt.show()
从数据可以看出:从⾏政区的福⽥区到龙岗区,房源的数量是逐渐增加的。
4. ⼩区房源数量TOP10
选⽤合适的图表,以居住⼩区为单位,对⽐分析各⼩区房源数量分布情况,并对TOP10进⾏可视化,对分析结果进⾏简单的总结。
area_small =set(d1["⼩区"])# 统计多少个⼩区
# print(area_small)
# 创建⼀个DataFrame 对象,筛选需要数据{⼩区,⼩区房源数量}
d_samll = pd.DataFrame({"⼩区":d1["⼩区"].unique(),"⼩区房源数量":[0]*len(area_small)}) print(d_samll)
print('-'*40)
# groupby统计⼩区房源数量,并从⼤到⼩排序
groupby_area = d1.groupby(by="⼩区").count()
# print(groupby_area)
d_samll["⼩区房源数量"]= groupby_area.values
d_samll = d_samll.sort_values(by=["⼩区房源数量"],ascending=False)
print(d_samll)
d_top10 =  d_samll.head(10)# 取前⼗
print("⼩区房源数量TOP10是:\n",d_top10)
# 绘图
冷弯管import matplotlib.pyplot as plt
艾金梅import matplotlib
X = d_top10["⼩区"]
print(X)
Y = d_top10["⼩区房源数量"]
print(Y)
plt.figure(figsize=(8,6),dpi=300)
plt.bar(X, Y, width=0.5, linewidth=2)
for i,j in zip(X, Y):
<(i, j,"%d"% j, fontsize=12)
plt.xlabel("⼩区")
plt.ylabel("⼩区房源数量")
plt.title("⼩区房源数量TOP10")
plt.savefig(r"C:\Users\锦樽\Desktop\⼩区房源数量TOP10.png",dpi=400)
plt.show()
从图可知,⼩区的房源数量从 丰湖花园到 名仕阁逐渐递减,⽽且丰湖花园⼩区房源是其他⼩区的两倍左右,丰湖花园的房源很多,在该竞争领域很⼤优势。
5. 户型TOP10分布

本文发布于:2024-09-25 05:20:47,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/299334.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:房源   数量   分析
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议