Python如何爬取网易云音乐
这篇文章主要介绍Python如何爬取网易云音乐,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
代码如下:
import os from lxml import etree import requests # 设置头部信息,防止被检测出是爬虫 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36' } url = "https://music.163.com/discover/toplist?id=3778678" base_url = 'http://music.163.com/song/media/outer/url?id=' # 新建一个字典用于存储最终所需要的数据 d = dict() re = requests.get(url=url, headers=headers).text # 构造了一个XPath解析对象并对HTML文本进行自动修正 html = etree.HTML(re) # XPath使用路径表达式来选取 x = html.xpath('//a[contains(@href,"/song?")]') # 对取到的数据进行筛选 for data in x: # 获取到音乐url href = data.xpath('./@href')[0] id = href.split("=")[1] href = base_url + "%s.mp3">
效果如下:
以上是“Python如何爬取网易云音乐”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!