数据分析

分析了东莞 城市学院的用与购电记录共一百二十万余条后,我有何发现?

前言

学校在今年年初启用了“智能电表”,带来了以下几个features: 智能欠费停电,智能超功率停电,智能圈存机不定期故障……

还有一个比较重要的feature,那就是提供了一个线上“用电信息查询系统”,可以在线查询每天的用电情况、电量余额以及充值历史。嗯,不能在线充值……

用电信息查询系统的使用很简单,查询不需要验证身份,更不需要填写验证码,直接选择区域、楼层以及宿舍号就行了:

记录查询页面:

 

这系统,好像有点方便批量爬取数据,嘿嘿……

数据的获取

程序使用PHP编写,已托管在我的GITHUB上,难登大雅之堂的代码,就不放链接啦。

花了两三个小时,成功遍历了所有宿舍从2017年02月19日至2017年10月23日的用与购电记录,共1,220,893条。

数据分析计划

针对以下几个我比较感兴趣的问题,对数据进行了分析:

  • 学校的每日/月用电,在这段时间中,有何变化?
  • 各天/月用电最多的是哪个宿舍?用了多少度电?
  • 在登上各天用电量榜首的宿舍中,各宿舍总共登过多少次天榜首?
  • 各宿舍区,月用电变化趋势如何,是否存在“不一般的宿舍区”?
  • 各天用电情况,是否和今天是周几有关?
  • 各月份,宿舍月用电量分布情况如何?
  • 充值电量时,哪些充值金额比较受欢迎?
  • 充值电量时,学生最喜欢选择哪个时间去充值?
  • 各宿舍区的平均充值金额

学校的每日/月用电,随时间推移,有何变化?

学校日用电量变化趋势:

在今年二月到四月上旬,学校宿舍各天的用电总量都维持在10K千瓦·时上下浮动,在03月31日,有个2.47万千瓦·时的峰,查了下东莞的历史天气,在03月30日,东莞的气温达到了27摄氏度,个人猜测,大概是因为当天晚上睡觉时,一部分宿舍开了空调导致。

从日电量使用可以大概看出东莞的气温变化,如果没有错,东莞是从今年四月开始逐渐升温的,温度高了,开空调的宿舍多起来,耗电量自然增多。

到了七八月,进入暑假,日耗电量从大概07月02号开始下降,直到07月09号,我猜到九号,学校的人都走得七七八八了。不过有点奇怪,在暑假期间,学校日耗电量居然也维持在一万千瓦·时左右,这个量可是开学了的二三月份的日耗电量呢?难道暑假期间留校的同学集体开空调的耗电,顶得上冬天全校宿舍的耗电?

九月份开学,日耗电量迅涨,达到了每天七万千瓦·时,九月份果然热……

至于十月的两个谷底,不用我说你都为何啦!

月用电量变化趋势:

各天/月用电最多的是哪个宿舍?用了多少度电?

各天:

然后,这几天,这几个宿舍,这个用电量,应该是累加智能电表正式启用之前的数据的,不然就算24小时打火锅,也打不出那么多:

各月:

在登上各天用电量榜首的宿舍中,各宿舍登过多少次天榜首?

各宿舍区,月用电变化趋势如何,是否存在“不一般的宿舍区”?

除了七月在其余宿舍区都在下降的情况下,学五和学八不降反增,几乎所有宿舍区用电量变化趋势都是一致的。

暑假期间的学五、学八经历了什么?如果没错,这些电是暑假期间入住曾居住过已毕业的同学的学五与学八的“华润”以及“未来之星训练营”的人所用。

各天用电情况,是否和今天是周几有关?

放图:

周四最多,周六最少。

周四下午大家都没课,都待在宿舍“耗电”了。周六,大家是出去浪了,或者是出去浪,还是出去浪?

各月份,宿舍月用电量分布情况如何?

 

假设宿舍空调功率是1 K瓦,九月有三十天,可以估计在九月,大部分人一天使用空调十小时左右。

充值电量时,哪些充值金额比较受欢迎?

先来看看大范围的欢迎度:

综合来说,充值频率是随着金额的增长而降低。

再来看看前50个最受欢迎的充值金额:

 

充值电量时,学生最喜欢选择哪个时间去充值?

每天各小时历史充值人数:

中午十二点的历史充值人数最多,也许是下课了去饭堂吃饭,就顺便充充电费吧。

那些凌晨去充电费的,是睡着睡着停电了吗……

每周各天历史充值人数:

除了周日,其余的各天基本差别不算大。为何周日比较少人充值呢?我也说不清了……

各宿舍区的平均充值金额

入住学1,学6的是16级,原来学校招的16级那么豪。