Python DrissionPage 爬虫 linux 部署说明 centos

这篇具有很好参考价值的文章主要介绍了Python DrissionPage 爬虫 linux 部署说明 centos。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目前 DrissionPage 是装在 linux centos 系统上面的 浏览器用的是115版本最新的chrome 浏览器

DrissionPage 插件官网地址:http://g1879.gitee.io/drissionpagedocs/

1,安装

pip3 install DrissionPage

2,表示引入主程序

from DrissionPage import ChromiumPage

3,设置调用浏览器地址 只需要执行一次生成配置文件即可

from DrissionPage.easy_set import set_paths

#表示调用浏览器的地址是多少
Windows 地址示例

set_paths(browser_path=r'C:/Users/AAA/AppData/Local/Google/Chrome/Application/chrome.exe') #windows的直接找chrome.exe文件

Linux 地址示例

set_paths(browser_path=r'/opt/google/chrome/google-chrome') #一般linux安装的google浏览器默认都在这个目录

4,最重要的一步 设置不显示浏览器调用访问,只需要在linux环境上打开注释即可

from DrissionPage.easy_set import set_headless, set_paths
set_headless(True)

5,最重要的一步

程序必须引入此配置表示无头加载
Python DrissionPage 爬虫 linux 部署说明 centos,linux,python,爬虫

6,ini配置说明

默认windows是不需要管的,只需要linux的时候设置一下注意端口不要冲突和chromedriver地址即可
服务器linux地址为

/usr/local/python3/lib/python3.7/site-packages/DrissionPage/configs

Python DrissionPage 爬虫 linux 部署说明 centos,linux,python,爬虫

1,表示chrome对应版本的 chromedriver地址
2,表示debug模式启动的端口,注意如果部署了selenium 端口不要冲突了 默认是9222 修改成9211或者其他都可以
3,表示chrome对应的安装地址,一般不需要动

ini配置代码文章来源地址https://www.toymoban.com/news/detail-678854.html

[paths]
chromedriver_path = /mkl/weipu/chromedriver-linux64/chromedriver
download_path = 

[chrome_options]
debugger_address = 127.0.0.1:9211
binary_location = /opt/google/chrome/google-chrome
arguments = ['--no-first-run', '--no-sandbox', '--disable-infobars', '--disable-popup-blocking', '--headless=new']
extensions = []
experimental_options = {'prefs': {'profile.default_content_settings.popups': 0, 'profile.default_content_setting_values': {'notifications': 2}}}
page_load_strategy = normal
user = Default
auto_port = False
system_user_path = False
[session_options]
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/603.3.8 (KHTML, like Gecko) Version/10.1.2 Safari/603.3.8', 'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'connection': 'keep-alive', 'accept-charset': 'GB2312,utf-8;q=0.7,*;q=0.7'}
[timeouts]
implicit = 10
page_load = 30
script = 30
[proxies]
http = 
https = 

7,代码示例说明

import time
import re
import math
from DrissionPage import ChromiumPage
from DrissionPage.easy_set import set_paths
from DrissionPage import ChromiumOptions
from DrissionPage.easy_set import set_headless, set_paths
set_headless(True)

#必须要加这个 表示在linux上无头加载
co = ChromiumOptions()
co.set_argument('--incognito')
co.set_argument('--no-sandbox');
#set_paths(browser_path=r'/opt/google/chrome/google-chrome')
#set_paths(browser_path=r'C:/Users/AAA/AppData/Local/Google/Chrome/Application/chrome.exe')
def start_test_spider(auth_name,institution_name,status_type):  
    # 用 d 模式创建页面对象(默认模式)
    page = ChromiumPage()
    # 跳转到登录页面
    page.get('https://xxx.com/')
    time.sleep(1)
    #选择点击事件 可以使用 xpath: 后面的是xpath路径
    page.ele('xpath://*[@id="basic_searchdomainfilter"]/div[1]/div[1]/div[1]/div/div/input').click()

    #这里为input的输入的内容 根据xpath
    page.ele('xpath://*[@id="basic_searchdomainfilter"]/div[1]/div[1]/div[2]/input').input('输入的内容')
    #关闭浏览器
    page.close_tabs()

到了这里,关于Python DrissionPage 爬虫 linux 部署说明 centos的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • linux系统下如何部署selenium爬虫程序

    linux系统下如何部署selenium爬虫程序

    随着互联网时代的到来,越来越多的企业热衷于通过大数据比对的方法获取一些有价值的行业信息,进而增加自己的企业竞争力。如何获取或者大面积收集有用的行业信息,是每一个数据公司都要考虑的事情。linux系统下部署selenium做网页爬虫,可以顶几十上百个人工采集数据

    2023年04月09日
    浏览(8)
  • Linux CentOS7安装chrome和chromedriver(WebDriver),用于selenium爬虫(java代码演示)

    Linux CentOS7安装chrome和chromedriver(WebDriver),用于selenium爬虫(java代码演示)

    序号 产品 版本 备注 1 CentOS 7.9 2 chrome 99.0.4844.51 chrome 与 ChromeDriver 的版本必须一致 3 ChromeDriver 99.0.4844.51 chrome 与 ChromeDriver 的版本必须一致 4 selenium 4.12.1 4 JAVA 8 1.1.1. chrome 下载 点击 chrome历史版本下载,按步骤下载 从下载的压缩包解压出rpm,上传 CentOS 系统 1.1.2. chrome 安装 安

    2024年02月20日
    浏览(9)
  • linux centos7部署telnet

    一、xinetd安装 telnet服务依赖于xinetd服务,所以需要首先安装xinetd服务 查看服务器是否安装有xinetd,如果已安装则进行下一步,没有则先安装xinetd服务 1、下载上传xinetd安装包 2、安装xinetd服务 3、启动xinetd服务 二、telnet安装 1、下载上传telnet安装包 第一个为telnet客户端安装包

    2024年02月10日
    浏览(13)
  • kkfileview安装部署Linux(CentOS、Debian)

    运行启动程序 观察日志, kkFileView 服务启动完成 http://ip:8081/index https://kkfileview.keking.cn/LibreOffice_7.1.4_Linux_x86-64_deb.tar.gz 解压.tar.gz文件后,你会在文件夹下看到一个新的 LibreOffice Deb 文件夹。 运行上面的命令后,LibreOffice 将被安装并可以使用了 至此可继续上面CentOS RPM中的第三

    2024年02月07日
    浏览(11)
  • .net6部署到linux上(CentOS Linux 7)

    .net6部署到linux上(CentOS Linux 7)

    目录 一、先在linux上配置.net环境 添加 Microsoft 包存储库 安装 SDK 安装运行时 检查 SDK 版本可使用终端查看当前安装的 .NET SDK 版本。 打开终端并运行以下命令。 二、创建.net6 mvc项目 并发布 创建项目   修改默认端口 打包发布到文件夹  运行打包项目查看项目是否ok  将项目

    2024年02月04日
    浏览(28)
  • linux centos7 django uwsgi 部署

    安装这里就不多说,直接配置问题及所遇到问题总结 django 项目 manage.py目录新建uwsgi.ini文件 uwsgi配置 [uwsgi] socket = 127.0.0.1:9000 # uwsgi直接访问用http,nginx访问用socket http= 127.0.0.1:9000 chdir = /usr/local/www/项目目录 wsgi-file = /usr/local/www/项目目录/项目目录/wsgi.py module = 项目目录.wsgi

    2024年01月21日
    浏览(17)
  • Linux系统【centos7】怎么手动部署网站?

    Linux系统【centos7】怎么手动部署网站?

    要手动部署网站在CentOS 7系统上,请按照以下步骤操作: 1. 安装Apache服务器 在终端中使用以下命令安装Apache服务器: ``` sudo yum install httpd ``` 2. 配置防火墙 设置防火墙规则以允许HTTP和HTTPS流量: ``` sudo firewall-cmd --permanent --add-service=http  sudo firewall-cmd --permanent --add-service=http

    2024年02月05日
    浏览(9)
  • Linux系统(Centos7)部署JDK环境

    Linux系统(Centos7)部署JDK环境

    要想在将Java项目上线,则必须在Linux系统中部署Java项目,而要想Java项目在Linux系统中运行,则首先必须在LInux系统中部署JDK环境,具体步骤如下所示: 1.下载JDK8 JDK下载路径 目前官网下载jdk的时候需要登录,这边分享一个可以使用的账号,方便大家下载: 账号:913898356@qq.c

    2024年02月16日
    浏览(14)
  • 从零开始学python(十六)爬虫集群部署

    从零开始学python(十六)爬虫集群部署

    今天讲述Python框架源码专题最后一个部分,爬虫集群部署,前面更新了十五个从零开始学python的系列文章,分别是 : 1.编程语法必修篇 2.网络编程篇 3.多线程/多进程/协程篇 4.MySQL数据库篇 5.Redis数据库篇 6.MongoDB数据库篇 7.机器学习篇 8.全栈开发篇 9.Numpy/pandas/matplotlib篇 10.H

    2024年02月13日
    浏览(13)
  • Linux系统:CentOS 7 CA证书服务器部署

    Linux系统:CentOS 7 CA证书服务器部署

    目录 一、理论 1.CA认证中心 2.CA证书服务器部署 二、实验 1. CA证书服务器部署 三、总结 (1)概念 CA :CertificateAuthority的缩写,通常翻译成认证权威或者认证中心,主要用途是为用户发放数字证书 功能:证书发放、证书更新、证书撤销和证书验证。 作用:身份认证,数据的

    2024年02月10日
    浏览(10)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包