Detectar la falta de mapeo / corrupta Unicode en PDF - Code World

Detectar la falta de mapeo / corrupta Unicode en PDF

Others 2022-04-22 13:59:33 views: 0

Magpies3:

Mientras extraer texto de archivos PDF PDFBox algunos retornos galimatías. Esto se debe a una asociación Unicode falta o está dañado. Veo siguientes advertencias en la consola. Quiero ser capaz de detectar esto para poder marcar estos archivos PDF como corruptos.

Estoy buscando una solución que es mejor que los registros de análisis sintáctico.

¡Gracias por tu ayuda!

Muestra Console Logs:

WARNING: No Unicode mapping for CID+32 (32) in font F6
WARNING: Failed to find a character mapping for 32 in TimesNewRoman,Bold

A continuación posterior se cuenta también habla sobre el mismo tema, pero no habla de la manera de ser capaz de detectar esta en el lado de código y manejar el mismo: Problema con la lectura de algunos caracteres Unicode de un PDF utilizando PDFBox

Tilman Hausherr:

Una cuarta posibilidad (al lado de los tres dada en Aaron Digulla respuesta) es reemplazar showGlyph()al extender la PDFTextStripperclase:

protected void showGlyph(Matrix textRenderingMatrix, PDFont font, int code, String unicode, Vector displacement) throws IOException
{
    super.showGlyph(textRenderingMatrix, font, code, unicode, displacement);
    if (unicode == null || unicode.isEmpty())
    {
        // do stuff
    }
}

Supongo que te gusta

Origin http://43.154.161.224:23101/article/api/json?id=201327&siteId=1

Detectar la falta de mapeo / corrupta Unicode en PDF

[Es] es error de mapeo modificado Validación fallida: 1: falta el tipo de mapeo

Elasticsearch: la costumbre de mapeo

Detectar la versión de Java en el teléfono Android en tiempo de ejecución

Cómo detectar eventos de toque fuera de la vista en servicio en segundo plano?

extracción corrupta con ZipArchive en PHP

Mapeo de mapas y mapeo flatMap en scala

El principio subyacente del mapeo BeanPropertyRowMapper y la recurrencia de fallas en el mapeo de campos en el caso del camello y la solución

Falta la solución para el cuerpo de solicitud requerido en la interfaz Api

ORA-30485: falta de expresión en el orden de la ventana de descripción

Cómo detectar la velocidad de transferencia de carga / descarga en Android?

Acerca de los cuatro métodos para detectar la conectividad del puerto de servicio en Linux

Cómo Vue Vue fuente de interpretación es para detectar cambios en la matriz

Cómo Vue Vue fuente de interpretación es para detectar cambios en la matriz

Cómo detectar el árbol de Navidad en la imagen, use Python para ayudarlo a lograr

Protradex: en forma de derivados en cadena, excavar profundamente el valor de la falta de liquidez en NFT

¡3 formas de detectar matrices en JavaScript!

Cómo resolver la falta de Adobe Flash al reproducir videos en Ubuntu 18.04

HQL consulta causando excepción la falta de espacio en disco

La falta de cualquier * (métodos estáticos) en Mockito 1. Cómo reemplazarlos razonablemente?

Falta el atributo HttpOnly detectado en la cookie de sesión

clave externa no se actualiza en la tabla secundaria en muchos a uno de mapeo en JPA arranque de primavera

Cómo utilizar patrón de observador en java para detectar cambios en la lista de Java?

Es la sustitución de un valor durante la iteración de una caja fuerte de mapeo en Python?

La operación de mapeo utiliza Elasticsearch

@RequestParam no mapeo de toda la cadena

Mapeo Fecha de inmediato añade a la semana

Cómo configurar el mapeo de resultados en el archivo de mapeo SQL en MyBatis

Resuelva el problema de la falta de sonido de fondo en el audio y vídeo de Agora Sound Network

programadores de Android en general, no pueden romper, estructuras de datos y algoritmos avanzados es la falta de conocimiento?

Recomendado

Clasificación

Diario

Más

2024-04-30(33)

2024-04-29(5)

2024-04-28(9)

2024-04-27(28)

2024-04-26(22)

2024-04-25(34)

2024-04-24(31)

2024-04-23(29)

2024-04-22(5)

2024-04-21(0)