Laravel  
laravel
文档
数据库
架构
入门
php技术
    
Laravelphp
laravel / php / java / vue / mysql / linux / python / javascript / html / css / c++ / c#

java读取pdf内容

作者:尒忸旳迣鎅゛沬卜鋽旳凄涼   发布日期:2026-05-30   浏览:48

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.File;
import java.io.IOException;

public class PDFReader {

    public static void main(String[] args) {
        // 指定PDF文件路径
        String pdfPath = "example.pdf";

        // 创建PDDocument对象,读取PDF文件
        try (PDDocument document = PDDocument.load(new File(pdfPath))) {
            // 使用PDFTextStripper类提取文本内容
            PDFTextStripper pdfStripper = new PDFTextStripper();
            // 获取PDF文件中的文本内容
            String text = pdfStripper.getText(document);
            // 输出提取的文本内容
            System.out.println(text);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

解释说明:

  1. 导入必要的包:使用了org.apache.pdfbox.pdmodel.PDDocumentorg.apache.pdfbox.text.PDFTextStripper来处理PDF文件。
  2. 指定PDF文件路径:通过String pdfPath变量指定要读取的PDF文件路径。
  3. 创建PDDocument对象:使用PDDocument.load()方法加载PDF文件。
  4. 使用PDFTextStripper类提取文本PDFTextStripper类用于从PDF中提取文本内容。
  5. 获取并输出文本内容:通过pdfStripper.getText(document)方法获取PDF中的文本,并打印到控制台。

确保你已经在项目中添加了Apache PDFBox库,可以通过Maven或手动下载JAR文件来引入该库。

上一篇:java解压zip

下一篇:java根据list中的对象某个属性排序

大家都在看

java url decode

java判断是windows还是linux

java连接数据库的代码

java date类型比较大小

java djl

ubuntu 卸载java

es java api

java list 查找

java 解压rar

jsonobject.tojavaobje

Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3

Laravel 中文站