头条资讯网_今日热点_娱乐才是你关心的时事

今日热点 时事资讯
娱乐头条才是你关心的新闻
首页 > 头条资讯 > 科技

青鸟飞扬 Python—爬虫+可视化+数据分析+数据库(数据分析篇)

一、天生歌词词云首先我们需要先获取所有爬取到的歌曲的歌词,将他们合成字符串随后提取其中的中文,再合成字符串

之后使用jieba进行分词,并将其中分出来的长度大于即是2的词留存

接下来为天生的词云选择一张好看的图片,就可以开始天生了!

WordCloud参数中的contour_width=1,contour_color=/"lightblue’分别为背景图片轮廓线条的粗细和颜色,假如没有设置则不会泛起轮廓,font_path是用来指定字体的天生后可以通过show展示也可以通过留存到本地并打开,终极结果如下

二、热点歌手歌曲量饼图

首先是获得热点歌手列表以及热点歌手歌曲量随后用每个歌手歌曲数目除以所有这十个歌手的总歌曲数目,得到每个歌手歌曲量的占比接下来可以选择设置哪一块凸起显示,如图中周杰伦部门凸起显示如下只需要将凸起部门的值设置大即可接下来就可以天生饼图了

其中x是歌曲量占比的列表,labels是对应的标签(在此图中则为歌手的姓名),explode就是上文提到的凸起显示,这三个列表中的各个值是一一对应的,autopct是设置占比数值的显示方式,3.1f则表示占宽为3位(假如大于会原样输出),精度为1的浮点数同样可以选择直接show展示,或者留存到本地再打开三、歌曲热度占比条形图在之前我们通过爬虫获取了top500的歌曲的信息(如下),现在我们但愿对歌曲的热度进行分析,天生柱状图

效果图如下:

本来是想天生歌手拥有热点歌曲数目的柱形图的,但是那个爬取热点歌曲的网站中那些热点歌曲没有对应的歌手,还需要自己再去其他网站获得每首歌曲对应的歌手,太麻烦了就没这么做了,有爱好的小伙伴可以自己实现一下首先我们要获得每个热度范围的歌曲数目下面的data列表就是对应x元组范围的歌曲数目我们只要通过遍历歌曲热度列表,每次都在其data列表对应热度+1,终极即可得到每个热度范围的歌曲数目

接下来就是创建柱状图,首先解决中文乱码问题

随后即可通过plt.bar创建,其中第一个参数为横坐标数据,第二个参数为纵坐标数据,第三个参数为为柱状图填充颜色,第四个参数为透明度title,xlabel,ylabel显然就是该柱状图的标题,横坐标和纵坐标的名称

未经允许不得转载:头条资讯网_今日热点_娱乐才是你关心的时事 » 青鸟飞扬 Python—爬虫+可视化+数据分析+数据库(数据分析篇)

分享到:更多 ()
来源:会笑的青豆 编辑:科技

评论

留言/评论 共有条点评
昵称:
验证码:
匿名发表