20行代码来爬取某某云的榜单音乐

这篇具有很好参考价值的文章主要介绍了20行代码来爬取某某云的榜单音乐。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

今天来爬爬音乐,一丝丝的无聊

20行代码来爬取某某云的榜单音乐

前期准备

软件环境

  • Python3.8
  • pycharm

模块

requests、re、os 三个

其中requests是第三方模块需要手动安装一下
re、os都是内置模块,不需要安装

浏览器开发者工具

咱们需要学会如何使用开发者工具。

对此很多小伙伴都不会,因为每个浏览器的开发者工具细节上多少有一些差别,我建议都用谷歌浏览器,英文看不懂的话可以调成中文。

打开开发者工具,点击省略号,点击 shortcuts

20行代码来爬取某某云的榜单音乐

依次点击 preferences - language ,
直接拉到最下方选择中文即可。

20行代码来爬取某某云的榜单音乐

代码实现

本次实现步骤大致分为以下五步:

  1. 发送请求
  2. 获取数据
  3. 解析数据
  4. 保存数据

这里我就不讲怎么分析开发者工具了,有空(摸鱼 )做一个详细的教程,讲解开发者工具。

导入模块

import requests 
import re  
import os  

发送请求

url = 'https://网址自己打一下/discover/toplist?id=3778678'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

获取数据

result = re.findall('<li><a href="/song\?id=(\d+)">(.*?)</a></li>', response.text)
for music, title in result:
    music_url = f'http://music.163.com/song/media/outer/url?id={music}.mp3'
    music_content = requests.get(url=music_url, headers=headers).content

保存数据

with open(filename + title + '.mp3', mode='wb') as f:
    f.write(music_content)
    print(title)

当然这只是最简单的爬取榜单歌曲,
评论、歌词等等都可以爬取,
还有制作词云图、通过搜索下载,音乐下载器,
等等各种实现下载的方式。

好了,今天的分享就到这里,完整代码下方名片获取哈~

20行代码来爬取某某云的榜单音乐文章来源地址https://www.toymoban.com/news/detail-460942.html

到了这里,关于20行代码来爬取某某云的榜单音乐的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python爬虫-获取某某在线翻译的查询结果,爬取json文件并解析

    url,请求方式,请求格式,都在此请求的header中 (此内容浏览器不同显示内容应该也是一样的,我用的edge浏览器,我也试过chrom浏览器,效果一样) ctrl + b进入方法体内即可 解读response.text,这是一个包含Unicode字符的JSON字符串编码 也许我们需要翻译一下 将API接口返回的JS

    2024年02月06日
    浏览(12)
  • 使用selenium爬取猫眼电影榜单数据

    近年来,随着互联网的快速发展和人们对电影需求的增加,电影市场也变得日趋繁荣。作为观众或者投资者,我们时常需要了解最新的电影排行榜和票房情况。本文将介绍如何使用Python编写一个爬虫脚本,通过Selenium库自动化操作浏览器,爬取猫眼电影榜单数据,并保存为E

    2024年02月15日
    浏览(12)
  • 使用Python的Requests和BeautifulSoup库来爬取新闻网站的新闻标题、发布时间、内容等信息,并将数据存储到数据库中

    BeautifulSoup是Python的一个HTML/XML解析库,用于从HTML或XML文件中提取数据。结合Python的requests库,可以实现网页爬取和数据提取。 以下是一个简单的使用BeautifulSoup和requests库实现爬虫的示例:   用requests库和BeautifulSoup4库,爬取校园新闻列表的时间、标题、链接、来源。

    2024年02月10日
    浏览(18)
  • 【python爬虫实战】用python爬取爱奇艺电视剧十大榜单的全部数据!

    目录 一、爬取目标 二、讲解代码 三、查看结果 四、视频演示 五、附完整源码 本次爬取的目标是,爱奇艺电视剧类目下的10个榜单:电视剧风云榜-爱奇艺风云榜 ​ 可以看到,这10个榜单包含了: 热播榜、飙升榜、必看榜、古装榜、言情榜、都市榜、搞笑榜、年代榜、悬疑

    2024年02月08日
    浏览(19)
  • 强势挑战Java,Kotlin杀回TIOBE榜单Top 20!

    ⭐ 简单说两句 ⭐ 作者: 后端小知识 CSDN 个人主页 :后端小知识 🔎 GZH : 后端小知识 🎉 欢迎关注 🔎 点赞 👍 收藏 ⭐️ 留言 📝 🎁本次送书1~3本 取决于阅读量,阅读量越多,送的越多 😎欢迎大家在评论区留言,随机挑选幸运观众额, 选中的幸运观众将会通过私信告

    2024年02月07日
    浏览(12)
  • 【送书第三期】强势挑战Java,Kotlin杀回TIOBE榜单Top 20!学Kotlin看哪些书?

    与Java一样,Kotlin也是用于Android应用程序开发的编程语言,是Android官方支持的第二种编程语言。 2016年Kotlin正式发布,在Android“官宣”后曾在2017年进入TIOBE编程语言排行榜前20,这次回归用了5年多时间。如果说第一次上榜是靠“蹭热点”,那么这次上榜完全是“凭实力”。

    2024年02月08日
    浏览(8)
  • Python爬取酷我音乐

    🎈 博主: 一只程序猿子 🎈  博客主页: 一只程序猿子 博客主页 🎈  个人介绍: 爱好(bushi)编程! 🎈 创作不易:喜欢的话 麻烦您 点个👍和 ⭐ ! 🎈  欢迎访问我的主页(点我直达) 🎈 除此之外您还可以通过个人名片联系我 👉👉👉👉👉👉 额滴名片儿 目录 1.介绍

    2024年02月04日
    浏览(15)
  • Python自动爬取酷狗音乐工具

    在音乐列表页面右击鼠标,点击检查,然后依次执行下述步骤 得到这一坨东西 Ctrl+F,查找MP3  在整个网页链接中,后缀用连接的都是相关级的内容,逐一一段一段的删去........的内容,直至MP3格式的文件不存在,获得最简的链接 注意,由于酷狗的反爬能力升级,所获得的链

    2024年02月03日
    浏览(15)
  • 贴吧照片和酷狗音乐简单爬取

    很简单,主要是两大步 这里注意找准对应资源的 url ,如果对应资源不让程序代码访问,这里可以伪装成浏览器发起请求。 这里解析看具体情况,一般是筛选标签之中的信息或者资源,有很多筛选的第三方包和方法 导入 requests 和 lxml 两个第三方包,没有需要下载 找到我们需

    2024年02月12日
    浏览(7)
  • Python爬虫实战-批量爬取下载网易云音乐

    大家好,我是python222小锋老师。前段时间卷了一套  Python3零基础7天入门实战 https://blog.csdn.net/caoli201314/article/details/132882813 1小时掌握Python操作Mysql数据库之pymysql模块技术 https://blog.csdn.net/caoli201314/article/details/133199207 一天掌握python爬虫【基础篇】 涵盖 requests、beautifulsoup、se

    2024年02月05日
    浏览(21)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包