# 示例代码:使用 PyPDF2 库读取和操作 PDF 文件
# 首先需要安装 PyPDF2 库,可以通过 pip 安装:
# pip install PyPDF2
import PyPDF2
# 打开一个现有的 PDF 文件
with open('example.pdf', 'rb') as pdf_file:
# 创建一个 PdfReader 对象
reader = PyPDF2.PdfReader(pdf_file)
# 获取 PDF 文件的页数
num_pages = len(reader.pages)
print(f"该 PDF 文件共有 {num_pages} 页")
# 提取第一页的内容
first_page = reader.pages[0]
text = first_page.extract_text()
print("第一页内容如下:")
print(text)
# 创建一个新的 PDF 文件并写入内容
writer = PyPDF2.PdfWriter()
# 添加第一页到新的 PDF 文件中
writer.add_page(first_page)
# 将新创建的 PDF 文件保存到磁盘
with open('output.pdf', 'wb') as output_pdf:
writer.write(output_pdf)
# 解释说明:
# 1. 使用 PyPDF2 库可以轻松地读取、提取文本、合并和分割 PDF 文件。
# 2. `PdfReader` 用于读取现有 PDF 文件,`PdfWriter` 用于创建新的 PDF 文件。
# 3. `extract_text()` 方法可以从 PDF 页面中提取文本内容。
# 4. `add_page()` 方法可以将页面添加到新的 PDF 文件中。
上一篇:python 执行js
下一篇:pythonformat
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站