Word处理控件Aspose.Words功能演示:使用Java 将 Word DOC/DOCX 转换为 PDF

Aspose.Words是一种高级Word文档处理API,用于执行各种文档管理和操作任务。API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word。此外,

Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。

Aspose.words 最新下载(群:761297826)icon-default.png?t=N2N8https://www.evget.com/product/564/download

Word 到 PDF 的转换通常在共享文档之前使用。可以使用各种在线 Word 到 PDF 转换器,允许您转换单个或有限数量的 Word 文档。然而,随着新兴的 MS Word 自动化和报告生成解决方案的出现,自动将 Word 转换为 PDF 已成为系统的重要组成部分。此外,DOC/DOCX 到 PDF 的批量转换需要自动完成,以最大限度地减少时间和精力。密切关注此类情况,我将向您展示如何在 Java 中以编程方式自动化将 Word DOC 或 DOCX 文档转换为 PDF 的过程。

Java Word 到 PDF 转换方案

您将在本文中了解以下 Word (DOC/DOCX) 到 PDF 的转换。

  • 在 Java 中将 Word 转换为 PDF
  • 在 Java 中将 Word DOC/DOCX 的选定页面转换为 PDF
  • 使用特定的 PDF 标准(例如 PDF 1.5、PDF/A-1a 等)将 Word 转换为 PDF。
  • 在 Java 中使用图像/文本压缩将 Word 转换为 PDF
  • 将 Word 转换为具有 Java 图像自定义 JPEG 质量的 PDF

Java Word 到 PDF 转换 API

为了将 Word DOCX/DOC 转换为 PDF,我们将使用Aspose.Words for Java,这是一个强大的 Word 自动化 API,用于处理流行的文字处理格式。您可以下载 Aspose.Words for Java或使用以下配置将其安装在基于 Maven 的应用程序中。

存储库:

<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>

依赖:

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>20.1</version>
<classifier>jdk17</classifier>
</dependency>

在 Java 中将 Word DOC/DOCX 转换为 PDF

要将 Word 文档转换为 PDF,您只需加载 Word 文档并以“.pdf”扩展名保存即可。以下是在 Java 中将 DOCX/DOC 转换为 PDF 的步骤。

  • 使用Document类加载 Word 文档。
  • 使用Document.save()方法将文档保存为 PDF 。

以下代码示例显示了如何在 Java 中将 Word DOC 转换为 PDF。

// Load the Word document from disk
Document doc = new Document("word.docx");
// Save as PDF
doc.save("output.pdf");

Word文档

PDF文档

在 Java 中将 Word DOC/DOCX 的选定页面转换为 PDF

如果您只想将 Word 的选择性页面转换为 PDF,您可以使用PdfSaveOptions类来完成。您可以通过指定起始页的索引来转换前 N 页或一系列页面。

以下是在 Java 中将 Word DOCX/DOC 的选定页面转换为 PDF 的步骤。

  • 使用Document类加载 Word 文档。
  • 创建PdfSaveOptions类的实例。
  • 设置起始页的索引和要转换的页数。
  • 使用Document.save()方法将 Word 文档保存为 PDF 。

以下代码示例显示了如何在 Java 中将 Word DOC/DOCX 的选定页面转换为 PDF。

// Load the Word document from disk
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Convert 3 pages starting from index 1 where 0 is the first page's index
options.setPageIndex(1);
options.setPageCount(3);
// Save Word as PDF
doc.save("output.pdf", options);

在 Java 中将 Word DOC/DOCX 转换为特定的 PDF 标准

PDF 文档可能符合各种 PDF 标准,例如 PDF/A-1a、PDF 1.5 等。如果您想将 Word 文档转换为特定的 PDF 标准,您可以使用 PdfCompliance 指定它。

以下代码示例显示了如何使用 Java 中的特定 PDF 标准将 Word DOCX 转换为 PDF。

// Load the Word document from disk
Document doc = new Document("word.docx");
// Set PDFSaveOption compliance to PDF15
PdfSaveOptions options = new PdfSaveOptions();
options.setCompliance(PdfCompliance.PDF_15);
// Convert Word to PDF
doc.save("output.pdf", options);

使用 Java 中的文本或图像压缩将 Word 转换为 PDF

您还可以通过压缩 Word 文档中的文本或图像来减小生成的 PDF 文档的大小。您可以使用Aspose.Words for Java在 Word 到 PDF 转换中应用以下压缩。

文本压缩选项

Aspose.Words for Java为PdfTextCompression类提供了以下文本压缩选项:

  • None:没有文本压缩。
  • Flate:Flate (ZIP) 压缩。

图像压缩

图像压缩选项在PdfImageCompression类中可用。

  • 自动:自动为每个图像选择最合适的压缩。
  • Jpeg:图像被转换为 JPEG 格式(不支持透明度)。

以下代码示例显示如何通过在 Java 中应用文本和图像压缩将 Word DOCX 转换为 PDF

// Load the Word document from disk
Document doc = new Document("word.docx");
PdfSaveOptions options = new PdfSaveOptions();
// Text and image compression
options.setTextCompression(PdfTextCompression.FLATE);
options.setImageCompression(PdfImageCompression.AUTO);
// Save Word as PDF
doc.save("output.pdf", options);

在 Java 中将 Word 转换为具有 JPEG 质量的 PDF

您还可以自定义和控制 Word 到 PDF 转换中的 JPEG 质量。PdfSaveOptions.setJpegQuality用于设置 JPEG 质量,它可以从 0(最大压缩的最差质量)到 100(最小压缩的最佳质量)。

以下代码示例显示了如何在 Java 中将 Word DOCX 转换为 PDF 时指定 JPEG 质量。

// Load the Word document from disk
Document doc = new Document("word.docx");
// Set Jpeg quality
PdfSaveOptions options = new PdfSaveOptions();
options.setJpegQuality(100);
// Convert Word to PDF
doc.save("output.pdf", options);

以上便是如何使用在 Java 中将 Word DOC/DOCX 转换为 PDF,要是您还有其他关于产品方面的问题,欢迎咨询我们,或者加入我们官方技术交流群

猜你喜欢

转载自blog.csdn.net/m0_67129275/article/details/130080640