main branch commit
爬取NBA中国官方网站各个赛季球员常规赛和季后赛的得分数据,并进行可视化。
由于网站变化,代码可能无法实现想要的效果(代码为2021年8月所编写),但可以为爬虫初学者提供一种思路!
在进入到数据界面后,可能最头疼的是无法在源代码中找到这些数据,但其实可以通过浏览器工具,右键检查或者F12,进入下面图片红框选中的地方,耐心在preview中寻找你想要的数据,然后可以在headers中找到网址,这个便是我们爬虫所需的url。
接着我们分析网址的格式,通过Python对字符串的操作,可以得到不同时间的数据。比如说可能网址中有2021,把它改为2018,应该就能得到2018年的数据。利用一个for循环即可实现爬取。 由于当初初学,只会将爬取的数据的数据保存为txt格式,这还费了不少劲将它转成Excel才能用作可视化 哦对,可视化是利用一个叫flourish的网站,可以在B站上学习如何使用。 上传完数据,可视化后,我还对视频做了一些剪辑,最终呈现形式可以在b站查看:https://www.bilibili.com/video/BV1z64y1B7YC 欢迎大家前来观看,如果觉得不错,可以点赞支持一下喔
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
Python-spider-for-NBA
爬取NBA中国官方网站各个赛季球员常规赛和季后赛的得分数据,并进行可视化。
说明
由于网站变化,代码可能无法实现想要的效果(代码为2021年8月所编写),但可以为爬虫初学者提供一种思路!
思路
在进入到数据界面后,可能最头疼的是无法在源代码中找到这些数据,但其实可以通过浏览器工具,右键检查或者F12,进入下面图片红框选中的地方,耐心在preview中寻找你想要的数据,然后可以在headers中找到网址,这个便是我们爬虫所需的url。
接着我们分析网址的格式,通过Python对字符串的操作,可以得到不同时间的数据。比如说可能网址中有2021,把它改为2018,应该就能得到2018年的数据。利用一个for循环即可实现爬取。 由于当初初学,只会将爬取的数据的数据保存为txt格式,这还费了不少劲将它转成Excel才能用作可视化 哦对,可视化是利用一个叫flourish的网站,可以在B站上学习如何使用。 上传完数据,可视化后,我还对视频做了一些剪辑,最终呈现形式可以在b站查看:https://www.bilibili.com/video/BV1z64y1B7YC 欢迎大家前来观看,如果觉得不错,可以点赞支持一下喔