ComPDFKit 转档SDK OCR表格识别功能

我们非常高兴地宣布，适用于 Windows、iOS、Android 和服务器的 ComPDFKit 转档SDK 1.8.0 现已发布！在该版本中，OCR 功能支持了表格识别，优化了OCR文字识别率。PDF to HTML 优化了html 文件结构，使转换后的 HTML 文件容量大幅减少。

OCR 表格识别：

Windows:

CPDFConvertWordOptions wordOptions = new CPDFConvertWordOptions();

wordOptions.IsAllowOCR = false;

Mac:

CPDFConvertWordOptions *options = [[CPDFConvertWordOptions alloc] init]

autorelease];

[options setIsAllowOCR:YES];

如果您想了解更多平台有关如何使用OCR的更多信息，请访问我们详细的OCR指南。

PDF to HTML：

Windows:
string resPath = “";
string inputFilePath = "”;
string outputFolderPath = “";
string outputFileName = "”;

CPDFConverter.Init(resPath);
CPDFConverterHTML converter = CPDFConvertFactroy.CreateConverter(CPDFConvertType.CPDFConvertTypeHtml, inputFilePath) as CPDFConverterHTML;

CPDFConvertHTMLOptions htmlOptions = new CPDFConvertHTMLOptions();
htmlOptions.PageAndNavigationPaneOpts = PageAndNavigationPaneOptions.SinglePageNavigationByBookmarks;
htmlOptions.IsAllowOCR = false;
htmlOptions.IsContainAnnotations = true;
htmlOptions.IsContainImages = true;

int pageCount = converter.GetPagesCount();
int[] pageArray = new int[pageCount];
for (int i = 0; i < pageArray.Length; i++)
{
pageArray[i] = i + 1;
}

ConvertError error = ConvertError.ERR_UNKNOWN;
converter.Convert(outputFolderPath, ref outputFileName, htmlOptions, pageArray, ref error, getPorgress);

如果您想了解更多平台有关如何使用PDF to HTML转换的更多信息，请访问我们详细的PDF to HTML指南。

问题修复：

修复了 PDF 转 Word 对繁体文档进行 OCR 时可能会Crash 问题。
修复了 PDF 转 RTF 会多出一页空白页的问题。
修复了 PDF 转 RTF 的**OnProgress()**回调函数返回进度过慢的问题。
修复了 PDF 转 Excel 在文档没有表格的情况下，OnlyTable等于 true 时，返回转换失败的问题，现在会生成一个空白的 Excel 文件。
修复了 PDF 转 HTML 部分文件链接无法跳转的问题。
修复了 PDF 转 HTML 部分文件注释丢失的问题。
修复了 PDF 转 jpg 和 png，传入DPI 参数为负数时 Crash 问题。

总的来说，我们相信此次更新将把您使用 ComPDFKit 的体验提升到一个全新的水平。我们将继续优化我们的功能，为每一位用户提供更好的用户体验。欢迎您联系我们，试用 ComPDFKit 并向我们提供反馈意见。

ComPDFKit 转档SDK OCR表格识别功能

猜你喜欢