用户注册



邮箱:

密码:

用户登录


邮箱:

密码:
记住登录一个月忘记密码?

发表随想


还能输入:200字
云代码 - python代码库

网易云免费歌曲下载爬虫

2022-04-05 作者: 大盗举报

[python]代码库

import requests            # 用于获取网页内容的模块
from bs4 import BeautifulSoup    # 用于解析网页源代码的模块
header={  # 伪造浏览器头部,不然获取不到网易云音乐的页面源代码。
  'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.80 Safari/537.36',
}
link = "https://music.163.com/discover/toplist?id=3778678"       # 这是网易云音乐热歌榜的链接(其实是嵌套在网页里面含有歌曲数据的页面框架的真实链接)
r = requests.get(link, headers=header)  # 通过 requests 模块的 get 方法获取网页数据
html = r.content  # 获取网页内容
soup = BeautifulSoup(html, "html.parser")  # 通过 BeautifulSoup 模块解析网页,具体请参考官方文档。
songs = soup.find("ul", class_="f-hide").select("a", limit=10)  #通过分析网页源代码发现排行榜中的歌曲信息全部放在类名称为 f-hide 的 ul 中,于是根据特殊的类名称查找相应 ul,然后找到里面的全部 a 标签,限制数量为10,即排行榜的前 10 首歌。

i = 1 # 设置一个自增参数,表示歌曲的数目

for s in songs:    # 遍历输出数组 songs 中的内容
    song_id = s['href'][9:]   # 只截取歌曲链接中的 ID 部分,因为网页中链接的形式为“/song?id=496870798”,从 = 号之后的就是歌曲的 ID 号。
    song_name = s.text   # 获取 a 标签的文本内容,即歌曲的名称。
    song_down_link = "http://music.163.com/song/media/outer/url?id=" + song_id + ".mp3"   # 此处id=3778678 可替换成任意歌单。根据歌曲的 ID 号拼接出下载的链接。
    print("第 " + str(i) + " 首歌曲:" + song_down_link)
    print("正在下载...")
    

    response = requests.get(song_down_link, headers=header).content # 亲测必须要加 headers 信息,不然获取不了。
    f = open(song_name + ".mp3", 'wb') # 以二进制的形式写入文件中
    f.write(response)
    f.close()
    print("下载完成.\n\r")
    i = i + 1


网友评论    (发表评论)


发表评论:

评论须知:

  • 1、评论每次加2分,每天上限为30;
  • 2、请文明用语,共同创建干净的技术交流环境;
  • 3、若被发现提交非法信息,评论将会被删除,并且给予扣分处理,严重者给予封号处理;
  • 4、请勿发布广告信息或其他无关评论,否则将会删除评论并扣分,严重者给予封号处理。


扫码下载

加载中,请稍后...

输入口令后可复制整站源码

加载中,请稍后...