PDF提取 PDF截取

1年前作者：尾张大分类：Toy博客阅读(8)违法举报

这篇具有很好参考价值的文章主要介绍了PDF提取 PDF截取。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

想截取一个pdf的前两页，TMD WPS还收费，这能难住一个程序员？

于是用python 搞了个小工具，分分钟解决问题。看到这篇文章的不管是不是程序员，只要有这个需求都可以联系我，免费帮大家解决有关PDF的问题。wx: yrn1840文章来源地址https://www.toymoban.com/news/detail-697499.html

# pip install PyPDF2
from PyPDF2 import PdfWriter, PdfReader
 
# 开始页
start_page = 0
# 截止页
end_page = 2
 
output = PdfWriter()
reader = PdfReader(open("input.pdf", "rb"))
pdf_pages_len = len(reader.pages)
print(pdf_pages_len)  # 打印总页数

# 保存input.pdf中的1-2页到output.pdf
for i in range(start_page, end_page):
    output.add_page(reader.pages[i])
outputStream = open("output.pdf", "wb")
output.write(outputStream)

到了这里，关于PDF提取 PDF截取的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

用python提取PDF中各类文本内容的方法
从PDF文档中提取信息，是很多类似RAG这样的应用第一步要处理的事情，这里需要做好三件事：提取出来的文本要保持信息完整性，也就是准确性提出的结果需要有附加信息，也就是要保存元数据提取过程要完成自动化，也就是流程化然而，在我们开始之前，我们需要指定目
2024年02月01日
浏览(10)
Python实操 PDF自动识别并提取Excel文件
最近几天，paddleOCR开发了新的功能，通过将图片中的表格提取出来，效果还不错，今天，作者按照步骤测试了一波。首先，讲下这个工具是干什么用的：它的功能主要是针对一张完整的PDF图片，可以对文档图片中的文本、表格、图片、标题与列表区域进行分类。同时还可以
2024年02月09日
浏览(14)
通过Python的pdfplumber库提取pdf中的文字
大家好，我是空空star，本篇给大家分享一下《通过Python的pdfplumber库提取pdf中的文字》。之前给大家分享了《通过Python的PyPDF2库提取pdf中的文字》，感兴趣的同学可以阅读下。本篇演示所用python版本： Python 3.8.9 通过Python的PyPDF2库提取pdf中的文字 pdfplumber是一个用于从PDF文
2024年02月06日
浏览(11)
通过Python的fitz库提取pdf中的图片
大家好，我是空空star，本篇给大家分享一下《通过Python的fitz库提取pdf中的图片》。 Fitz库是一个Python图像处理库，主要用于打开、编辑和保存PDF、TIFF和JPEG格式的图像。它可以帮助用户读取和写入PDF文件，提取PDF页面以及在页面上进行标记和注释。此外，Fitz库还提供了一些
2024年02月07日
浏览(11)
Python 实战 | 从 PDF 中提取（框线不全的）表格
更多详情请点击查看原文：Python 实战 | 从 PDF 中提取（框线不全的）表格 Python教学专栏，旨在为初学者提供系统、全面的Python编程学习体验。通过逐步讲解Python基础语言和编程逻辑，结合实操案例，让小白也能轻松搞懂Python！点击此处查看往期Python教学内容本文目录一、引
2024年04月14日
浏览(14)
通过Python的pdfplumber库提取pdf中表格数据
大家好，我是空空star，本篇给大家分享一下《通过Python的pdfplumber库提取pdf中表格数据》。 pdfplumber是一个用于从PDF文档中提取文本和表格数据的Python库。它可以帮助用户轻松地从PDF文件中提取有用的信息，例如表格、文本、元数据等。pdfplumber库的特点包括：简单易用、速度
2024年02月06日
浏览(12)
python提取pdf文件中的图片并输出到本地
2024年02月11日
浏览(11)
通过Python的PyPDF2库提取pdf中的文字
PyPDF2是一个用于处理PDF文件的Python库，它提供了许多用于读取和操作PDF文件的功能。它可以对PDF文件进行合并、分割、旋转、提取页面、加密和解密等操作，也可以添加文本、图像和水印等元素到PDF文件中。 PyPDF2库允许开发人员通过Python代码轻松地处理PDF文件，因为它提供了
2024年02月11日
浏览(15)
通过Python的PyPDF2库提取pdf中的图片
大家好，我是空空star，本篇给大家分享一下通过Python的PyPDF2库提取pdf中的图片。上一篇已经给大家分享了提取pdf中的文字，感兴趣的同学可以阅读下。本篇演示所用python版本： Python 3.8.9 通过Python的PyPDF2库提取pdf中的文字 PyPDF2库是一个用于处理PDF文件的Python库。它提供了
2024年02月06日
浏览(13)
Python-pdfplumber读取PDF所有内容并自行提取指定内容
🌸 欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手 🏳️‍🌈 博客主页：一晌小贪欢的博客主页 👍 该系列文章专栏：Python办公自动化专栏文章作者技术和水平有限，如果文中出现错误，希望大家能指正🙏 ❤️ 欢迎各位佬关注！ ❤️ 最近接到一个需求
2024年02月15日
浏览(14)