Java PDF a Word

Utilice java api para simplemente realizar la función de convertir documentos pdf a documentos de Word.
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

import java.io.*;

public class PdfToWord {

    public static void main(String[] args) {
        String pdfPath =  "D:\\Tools\\Spring.pdf";

        try {
            PDDocument doc = PDDocument.load(new File(pdfPath));
            int pageNum = doc.getNumberOfPages();
            pdfPath = pdfPath.substring(0, pdfPath.lastIndexOf("."));
            String fileName = pdfPath+".doc";
            File file = new File(fileName);
            if(!file.exists()){
                file.createNewFile();
            }
            FileOutputStream fos = new FileOutputStream(file);
            Writer writer = new OutputStreamWriter(fos,"UTF-8");
            PDFTextStripper textStripper = new PDFTextStripper();
            textStripper.setSortByPosition(true);
            textStripper.setStartPage(1);
            textStripper.setEndPage(pageNum);
            textStripper.writeText(doc,writer);
            writer.close();
            doc.close();

            System.out.println("转换成功");

        } catch (IOException e) {
            e.printStackTrace();
        }


    }

}

El paquete jar utilizado en este artículo, pdfbox-1.8.2.jar, jdk 1.8, está construido con gradle, compile ("org.apache.pdfbox: pdfbox: 1.8.2"), también puede descargar el paquete jar usted mismo.

Originalmente había un documento pdf con más de 90 páginas, pero no había etiquetas y era difícil de leer. Como programador, utilicé el programa de manera decisiva para realizarlo. Como resultado, el archivo convertido no tenía formato y no logró el efecto esperado.

Supongo que te gusta

Origin blog.csdn.net/wzs535131/article/details/108911424
Recomendado
Clasificación