3天2100万!周杰伦的说好不哭,20万点评Python来分析

3天2100万!周杰伦的说好不哭,20万点评Python来分析

最近今天,小编被周杰伦的新歌刷屏了,朋友圈纷纷晒出周杰伦的新歌,即便不是周杰伦的歌迷,但是提起他的新歌,想必大家应该都会知道,那就是《说好不哭》。不得不说,周董的号召力还是很强的。看到这首歌如此的受到大家的关注,小编忍不住想要对其分析一下,看一下大家对于这首歌的评价究竟如何。


1

爬取QQ音乐点评


这次小编找的是QQ音乐的评论,看这周董的帅气的封面,音乐才子名不虚传,短短3天已经卖了700万张,看一下评论数有21W的点评数,这人气太旺了!

3天2100万!周杰伦的说好不哭,20万点评Python来分析既然有20万的点评,这个数据量还是很大的。二话不说,用Python迅速爬取。如下图所示,大家可以按照下图箭头所指的位置,找到大家的评论。

3天2100万!周杰伦的说好不哭,20万点评Python来分析



经过检验发现,当请求的时候,需要大家不断改变的是pagenum和lastcommentid这两个参数。评论爬取的部分程序如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析

这里,通过不断的更新页面数值,并根据爬取的commentid数值来更新lastcommentid的数值,便可以源源不断的爬取到大家的评论,这里,小编爬取了大家的评论和评论时间,昵称以及commentid四个参数,爬取了20万+条评论,如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析

得到数据之后,接下来是对于数据的处理我们首先来看一下,评论数目前十名的评论有哪一些,如下图所示,很简单的一句程序,便可以得到我们需要的结果。

3天2100万!周杰伦的说好不哭,20万点评Python来分析


在所爬取的数据中,点赞第一名有14100+的点赞数量,他的评论是这样的:


3天2100万!周杰伦的说好不哭,20万点评Python来分析

评价很专业,很走心,一看就是铁粉干的,而且还是很有档次很懂音乐的funs。


2

看一下点评的数据


下面我们看一下,大家的评论数目随着时间的变化情况,如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析

如上图所示,歌曲是16号23点正式上线与大家见面,立刻引起了大家的评价,可以看见,在歌曲出来的短短一两个小时内,评论数目激增,然后随着入夜大家睡去,评论数目略有下降。而第二天的评论数目虽有小幅度的提升,到那时提升的幅度并不是很大。
这部分的程序如下图所示:

3天2100万!周杰伦的说好不哭,20万点评Python来分析

程序利用的是seaborn库,程序将柱状图与折线图结合起来,更加立体的为大家呈现出评论数目与时间的关系。


3

词云看20W的点评


最后为大家展示的是大家评论的词云制作,看看大家对该首歌的印象。
首先,需要对大家的评论进行预处理,因为爬取到的结果中包含众多的字符,这些字符需要去除。程序如下图所示。

3天2100万!周杰伦的说好不哭,20万点评Python来分析

上述程序中,我们匹配中文字符和中文标点符号,然后写入指定的文件内,最后利用wordcloud库来制作词云即可:

3天2100万!周杰伦的说好不哭,20万点评Python来分析


看一下大家都说了点啥

3天2100万!周杰伦的说好不哭,20万点评Python来分析

由上图可以看出,大家对于周董的新歌是非常喜欢的,并且都非常的开心,由于信的加入,导致大家在评论的时候会加入五月天的元素。

以上就是本次小编带来的对于周董新歌的分析,小编也准备去买个vip听一下,好好的欣赏周董的新歌曲啦。


数据分析和爬虫:

还怕电脑被偷吗?我用Python偷偷写一个自动木马程序

厉害了!实战爬取全网5000部手机|上篇

南京的房子卖的有多火|二手房成交数据分析上篇

南京的房子有多贵| 分析近20000套二手房的数据


获取干货源码,阅读更多有趣的案例,也可以直接去微信公众号【菜鸟学Python】获取。
菜鸟学Python » 3天2100万!周杰伦的说好不哭,20万点评Python来分析