python爬取视频

这篇具有很好参考价值的文章主要介绍了python爬取视频。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

适合新手小白揣摩;
环境准备:

设备 软件版本
windows 环境(可上网) pycharm 3
# 爬虫思路
# 1.确定爬取的url路径,headers参数
# 2.发送请求, --- requests 模拟浏览器发送请求,获取响应数据
# 3.解析数据, --- json模块, 把json字符串转换成python可交互的数据类型
# 4.保存数据, --- 保存到目标文件夹中


import requests
import json


def video_spider():
    # 遍历需要爬取的页数 一共爬取10页。
    for page in range(1,11):
        # 将爬取该网页的页数打印出来
        print('+++++++++++++正在爬取第{}页数据++++++++++++++'.format(page))
        # 1.确定爬取的url路径,headers参数
        # global data_title, video_data
        base_url = 'https://v.6.cn/minivideo/getMiniVideoList.php'
        headers = {
            'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'}
        # 多页视频一起拉取,这个值在网页的 F12中的 payload 查找
        params = {
            'act':'recommend',
            'page': str(page),
            'pagesize':'30'
        }
        # 2.发送请求, --- requests 模拟浏览器发送请求,获取响应数据
        # 将页数参数值在params=params表示出来。
        response = requests.get(base_url, headers=headers,params=params)
        data = response.text
        # print(data)

        # 3.解析数据, --- json模块, 把json字符串转换成python可交互的数据类型
        # 将json数据转换为字典
        dict_data = json.loads(data)  # (字典)
        # print(dict_data)

        # 解析数据,将数据以列表格式提取出来
        data_list = dict_data['content']['list']  # (列表)
        # print(data_list)

        # 遍历列表下的字典
        for data_dict in data_list:
            # print(data_dict)
            # 提取出来关键字,分别标题和mp4链接地址
            # data_title = data_dict['title']
            # 上面提取出来的标题不是以.mp4结尾的,需要修改为 .mp4结尾的文件 ,如下:
            video_title = data_dict['title']
            # video_title.replace('/','-')  表示遇到名称里面包含/的特殊字符 替换成 '-'
            video_title01 = video_title.replace('/','-') + '.mp4'
            video_url = data_dict['playurl']
            # print(video_title, video_url)
            print('正在下载:', video_title01)

            # 使用视频链接获取视频数据:
            # 通过requests.get 方法,把视频url地址传递进去,并且少不了请求头参数headers
            # 模拟浏览器,帮助我们去发送视频链接的url
            # 使用video_data 去接收,自定义命名.
            # 通过发送请求会返回一个响应对象,从响应对象中提取数据,因为视频是个二进制数据,所以需要通过.content 把二进制数据反馈出来
            video_data = requests.get(video_url, headers=headers).content

            # 4.保存数据, --- 保存到目标文件夹中
            # 目标文件夹需要新建,在项目中新建一个 video 文件夹,将爬取的视频保存到 video 文件夹中
            # 需要知道 video01 文件夹在哪个位置
            # 通过 with open 将文件夹目录和标题保存到文件夹中  video\\ 双斜杠表示相对路径 文件名称以 data_title 命名
            # 视频数据是二进制数据,所以使用 wb 的方式进行写入  as 别名为 f
            # 通过 f.write 将视频数据传递进去
            # with open('video01\\' + video_title01, 'wb') as f:
            with open(video_title01, 'wb') as f:
                f.write(video_data)
                print('下载完成。。。\n')


if __name__ == '__main__':
    video_spider()


右键运行,结果如下:


如何爬取视频,python,音视频,爬虫
本地目录截图如下:
如何爬取视频,python,音视频,爬虫

详细视频链接地址

爬取网页详细地址文章来源地址https://www.toymoban.com/news/detail-624450.html

到了这里,关于python爬取视频的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 5G时代下,Android音视频强势崛起,我们该如何快速入门音视频技术?

    5G时代下,Android音视频强势崛起,我们该如何快速入门音视频技术?

    作为Android开发者的我们到底应不应该上音视频这条船? 接下来一起分析下。 大趋势 从未来的大趋势来看,随着5G时代的到来,音视频慢慢变成人们日常生活中的必需品。除了在线教育、音视频会议、即时通讯这些必须使用音视频技术的产品外,其它的产品也需要加入音频、

    2024年04月15日
    浏览(14)
  • 【音视频】如何播放rtsp视频流

    【音视频】如何播放rtsp视频流

    现阶段直播越来越流行,直播技术发展也越来越快。Webrtc和rtsp是比较火热的技术,而且应用也比较广泛。本文通过实践来展开介绍关于rtsp、webrtc的使用过程。 本文重点介绍如何播放rtsp视频流,通过ffplay方式以及VLC media player的方式来播放 可以参考上一篇博文:【音视频】基于

    2024年01月19日
    浏览(53)
  • 【音视频】基于NGINX如何播放rtmp视频流

    【音视频】基于NGINX如何播放rtmp视频流

    现阶段直播越来越流行,直播技术发展也越来越快。Webrtc、rtmp、rtsp是比较火热的技术,而且应用也比较广泛。本文通过实践来展开介绍关于rtmp如何播放。 本文重点介绍基于NGINX如何播放rtmp视频流 可以参考上一篇博文:【音视频】基于webrtc协议浏览器播放rtsp https://blog.csdn.n

    2024年01月19日
    浏览(23)
  • 抖音视频如何下载保存(方法分享)

    有时刷抖音视频,看的喜欢的视频想要下载到本地,但是有很多视频无法下载或者下载下来是有水印的,那怎么办呢? 抖音视频下载有两种情况: 一种是可以直接点击分享下载,然后可以直接点击保存到相册。 视频就自动下载下来了,但是这直接下载下来的视有水印。 还有

    2024年04月14日
    浏览(12)
  • Python获取音视频时长

    上代码:获取音视频时长.py pyinstaller -F 获取音视频时长.py 链接:https://pan.baidu.com/s/1WvsMyPHD3iFsM844gfC2Jg?pwd=yyds

    2024年02月15日
    浏览(16)
  • 音视频 FFmpeg如何查询命令帮助文档

    ffmpeg:超快音视频编码器 ffplay:简单媒体播放器 ffprobe:简单多媒体流分析器 基本信息:ffmpeg -h 高级信息:ffmpeg -h long 所有信息:ffmpeg -h full 所有信息:ffplay -h 所有信息:ffprobe -h ffmpeg/ffplay/ffprobe部分参数通用,部分参数不通用,在使用时需要注意 推荐一个零声学院项目课,个

    2024年02月12日
    浏览(14)
  • Python的音视频文件处理

    Python的音视频文件处理

    ffmpeg-python 是 ffmpeg 的一个包装,通过 python 调用 ffmpeg 的 API ,实现高效的音视频文件处理 开始之前 安装 ffmpeg 安装 ffmpeg-python 参考 ffmpeg官方网站 ffmpeg-python的代码库与技术文档 技术背景 音视频文件处理流程 输入文件 ⟹ 解封装 已编码的数据包 ⟹ 解码 被编码的帧 ( 可进行

    2024年02月03日
    浏览(17)
  • 用python解析抖音视频

    你可以使用 Python 的第三方库来解析抖音视频。其中有一个比较常用的库叫做 \\\"pydouyin\\\",你可以使用它来获取抖音视频的信息。 要安装这个库,你可以在命令行输入以下命令: 然后,你可以使用以下代码来解析抖音视频: 在这段代码中, get_video_info 方法接受一个抖音视频的

    2024年02月12日
    浏览(9)
  • 使用Python采集某网站视频,实现音视频自动合成!

    使用Python采集某网站视频,实现音视频自动合成!

      开发环境 模块的使用 采集下破站视频数据 通过开发者工具进行抓包分析,分析破站视频数据的来源。 开发者工具的使用 打开方式: 鼠标右键点击检查选择Network F12 ctrl + shift + i 想要开发者工具中有数据加载, 需要 刷新网页。 通过元素(Element)面板,我们能查看到想抓取

    2024年02月06日
    浏览(10)
  • Python音视频剪辑:大小调整的视频变换函数详解

    Python音视频剪辑:大小调整的视频变换函数详解 在音视频编辑中,常常需要对视频文件进行大小调整以适配不同的设备或场景。MoviePy是一款强大的Python库,提供了多种视频变换函数,可以方便地对视频进行大小调整。本文将介绍MoviePy中与大小相关的视频变换函数,并附上相

    2024年02月06日
    浏览(14)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包