之前给大家详细讲解过使用python去做了一系列的使用,其中最受大家欢迎的就是关于爬取内容了,最简单的就是数据爬取,后来还跟大家讲解过视频爬取,虽然大家现在都已经熟练掌握要怎么去运行这些内容,但是小编还是想针对这个爬取内容,给大家在详细概括下实例内容,比如今日要讲解的爬取音乐,详细内容请看下文哈~
本文内容主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例。
安装方法:
pip install beautifulsoup4
实现完整代码如下
import requests from bs4 import BeautifulSoup import time headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"} def get_info(url): wb_data=requests.get(url,headers=headers) soup=BeautifulSoup(wb_data.text,'lxml') # ranks=soup.select('#rankWrap > div.pc_temp_songlist > ul > li > span.pc_temp_num > strong') titles=soup.select('#rankWrap > div.pc_temp_songlist > ul > li > a') times=soup.select('#rankWrap > div.pc_temp_songlist > ul > li > span.pc_temp_tips_r > span') for title,time in zip(titles,times): data={ 'title':title.get_text().split('-')[0], 'song':title.get_text().split('-')[1], 'time':time.get_text().strip() } print(data) # 主函数(爬取酷狗TOP500歌曲) if __name__ == '__main__': urls=['https://www.kugou.com/yy/rank/home/{}-8888.html'.format(str(i)) for i in range(1,3)] for url in urls: get_info(url) time.sleep(1)
大家可以以这个实例为参考,直接导入实例到自己的编程软件里,去试试是否可以实现一样的内容,同时大家也可以进行模仿,爬取自己喜欢的音乐哦~