Utilice java api para simplemente realizar la función de convertir documentos pdf a documentos de Word.
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;
import java.io.*;
public class PdfToWord {
public static void main(String[] args) {
String pdfPath = "D:\\Tools\\Spring.pdf";
try {
PDDocument doc = PDDocument.load(new File(pdfPath));
int pageNum = doc.getNumberOfPages();
pdfPath = pdfPath.substring(0, pdfPath.lastIndexOf("."));
String fileName = pdfPath+".doc";
File file = new File(fileName);
if(!file.exists()){
file.createNewFile();
}
FileOutputStream fos = new FileOutputStream(file);
Writer writer = new OutputStreamWriter(fos,"UTF-8");
PDFTextStripper textStripper = new PDFTextStripper();
textStripper.setSortByPosition(true);
textStripper.setStartPage(1);
textStripper.setEndPage(pageNum);
textStripper.writeText(doc,writer);
writer.close();
doc.close();
System.out.println("转换成功");
} catch (IOException e) {
e.printStackTrace();
}
}
}
El paquete jar utilizado en este artículo, pdfbox-1.8.2.jar, jdk 1.8, está construido con gradle, compile ("org.apache.pdfbox: pdfbox: 1.8.2"), también puede descargar el paquete jar usted mismo.
Originalmente había un documento pdf con más de 90 páginas, pero no había etiquetas y era difícil de leer. Como programador, utilicé el programa de manera decisiva para realizarlo. Como resultado, el archivo convertido no tenía formato y no logró el efecto esperado.