PDF提取 PDF截取

这篇具有很好参考价值的文章主要介绍了PDF提取 PDF截取。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

想截取一个pdf的前两页,TMD WPS还收费,这能难住一个程序员?

于是用python 搞了个小工具,分分钟解决问题。看到这篇文章的不管是不是程序员,只要有这个需求都可以联系我,免费帮大家解决有关PDF的问题。wx: yrn1840文章来源地址https://www.toymoban.com/news/detail-697499.html

# pip install PyPDF2
from PyPDF2 import PdfWriter, PdfReader
 
# 开始页
start_page = 0
# 截止页
end_page = 2
 
output = PdfWriter()
reader = PdfReader(open("input.pdf", "rb"))
pdf_pages_len = len(reader.pages)
print(pdf_pages_len)  # 打印总页数

# 保存input.pdf中的1-2页到output.pdf
for i in range(start_page, end_page):
    output.add_page(reader.pages[i])
outputStream = open("output.pdf", "wb")
output.write(outputStream)

到了这里,关于PDF提取 PDF截取的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 用python提取PDF中各类文本内容的方法

    用python提取PDF中各类文本内容的方法

    从PDF文档中提取信息,是很多类似RAG这样的应用第一步要处理的事情,这里需要做好三件事: 提取出来的文本要保持信息完整性,也就是准确性 提出的结果需要有附加信息,也就是要保存元数据 提取过程要完成自动化,也就是流程化 然而,在我们开始之前,我们需要指定目

    2024年02月01日
    浏览(10)
  • Python实操 PDF自动识别并提取Excel文件

    Python实操 PDF自动识别并提取Excel文件

    最近几天,paddleOCR开发了新的功能,通过将图片中的表格提取出来,效果还不错,今天,作者按照步骤测试了一波。 首先,讲下这个工具是干什么用的: 它的功能主要是针对一张完整的PDF图片,可以对文档图片中的文本、表格、图片、标题与列表区域进行分类。同时还可以

    2024年02月09日
    浏览(14)
  • 通过Python的pdfplumber库提取pdf中的文字

    大家好,我是空空star,本篇给大家分享一下 《通过Python的pdfplumber库提取pdf中的文字》 。 之前给大家分享了 《通过Python的PyPDF2库提取pdf中的文字》 ,感兴趣的同学可以阅读下。 本篇演示所用python版本: Python 3.8.9 通过Python的PyPDF2库提取pdf中的文字 pdfplumber是一个用于从PDF文

    2024年02月06日
    浏览(11)
  • 通过Python的fitz库提取pdf中的图片

    通过Python的fitz库提取pdf中的图片

    大家好,我是空空star,本篇给大家分享一下 《通过Python的fitz库提取pdf中的图片》 。 Fitz库是一个Python图像处理库,主要用于打开、编辑和保存PDF、TIFF和JPEG格式的图像。它可以帮助用户读取和写入PDF文件,提取PDF页面以及在页面上进行标记和注释。此外,Fitz库还提供了一些

    2024年02月07日
    浏览(11)
  • Python 实战 | 从 PDF 中提取(框线不全的)表格

    Python 实战 | 从 PDF 中提取(框线不全的)表格

    更多详情请点击查看原文:Python 实战 | 从 PDF 中提取(框线不全的)表格 Python教学专栏,旨在为初学者提供系统、全面的Python编程学习体验。通过逐步讲解Python基础语言和编程逻辑,结合实操案例,让小白也能轻松搞懂Python! 点击此处查看往期Python教学内容 本文目录 一、引

    2024年04月14日
    浏览(14)
  • 通过Python的pdfplumber库提取pdf中表格数据

    通过Python的pdfplumber库提取pdf中表格数据

    大家好,我是空空star,本篇给大家分享一下 《通过Python的pdfplumber库提取pdf中表格数据》 。 pdfplumber是一个用于从PDF文档中提取文本和表格数据的Python库。它可以帮助用户轻松地从PDF文件中提取有用的信息,例如表格、文本、元数据等。pdfplumber库的特点包括:简单易用、速度

    2024年02月06日
    浏览(12)
  • 通过Python的PyPDF2库提取pdf中的文字

    通过Python的PyPDF2库提取pdf中的文字

    PyPDF2是一个用于处理PDF文件的Python库,它提供了许多用于读取和操作PDF文件的功能。它可以对PDF文件进行合并、分割、旋转、提取页面、加密和解密等操作,也可以添加文本、图像和水印等元素到PDF文件中。 PyPDF2库允许开发人员通过Python代码轻松地处理PDF文件,因为它提供了

    2024年02月11日
    浏览(15)
  • 通过Python的PyPDF2库提取pdf中的图片

    通过Python的PyPDF2库提取pdf中的图片

    大家好,我是空空star,本篇给大家分享一下通过Python的PyPDF2库 提取pdf中的图片 。 上一篇已经给大家分享了 提取pdf中的文字 ,感兴趣的同学可以阅读下。 本篇演示所用python版本: Python 3.8.9 通过Python的PyPDF2库提取pdf中的文字 PyPDF2库是一个用于处理PDF文件的Python库。它提供了

    2024年02月06日
    浏览(13)
  • Python-pdfplumber读取PDF所有内容并自行提取指定内容

    🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手 🏳️‍🌈 博客主页:一晌小贪欢的博客主页 👍 该系列文章专栏:Python办公自动化专栏 文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏 ❤️ 欢迎各位佬关注! ❤️ 最近接到一个需求

    2024年02月15日
    浏览(14)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包