Práctica de OCR en la nube de Tencent: reduzca los costos de operación financiera del servicio al cliente

I. Introducción:

Con el rápido desarrollo de la era de las imágenes, una gran cantidad de contenido de texto se publica y almacena en forma de imágenes para optimizar el diseño y los efectos de rendimiento, lo que aporta una gran comodidad a la difusión y seguridad del contenido y requiere trabajo repetitivo. .

Las herramientas de escaneo de texto OCR han ido surgiendo gradualmente, principalmente para ayudar a los usuarios a resolver el problema de la edición de contenido.

Insertar descripción de la imagen aquí

2. ¿Qué es el OCR?

El nombre completo de OCR es Reconocimiento óptico de caracteres, que significa "tecnología de reconocimiento óptico de caracteres".

1. El papel de la OCR:

El texto de la imagen se reconoce mediante tecnología OCR, se extrae y se convierte a formato de texto, y se generan algunos datos de texto estructurado.

Insertar descripción de la imagen aquí

2. El proceso de reconocimiento de texto mediante OCR:

El principio de OCR es utilizar un escáner para convertir la señal óptica del documento de caracteres chinos en una señal eléctrica a través de un dispositivo de carga acoplada (CCD), y luego convertirla en una señal digital a través de un convertidor analógico/digital y transmitirla. a la computadora. La computadora recibe imágenes digitales de manuscritos y luego reconoce los caracteres chinos en estas imágenes.

Insertar descripción de la imagen aquí

3. Selección de OCR:

Insertar descripción de la imagen aquí

4. Aplicación de OCR en la vida diaria:

Hoy en día, con el rápido desarrollo de la tecnología de reconocimiento inteligente, a través de una revisión cuidadosa, descubrí que la tecnología de reconocimiento OCR se aplica en todos los aspectos de la vida. Los siguientes son mis escenarios de aplicación reales en la vida. ¿Ves si tienes la misma experiencia?

(1) Niños haciendo deberes:

Normalmente, los mayores en casa ayudan a sus hijos con los deberes, si encuentran algo que no pueden hacer utilizarán el software "Homework Helper". Tome fotografías de las preguntas que no comprenda y cárguelas en el servidor. El servidor reconocerá el texto, buscará las preguntas correspondientes en el banco de preguntas y devolverá los resultados de la consulta a la interfaz.

Insertar descripción de la imagen aquí

(2) Operación de medios propios:

A menudo necesito ir a cuentas públicas para publicar algunas actividades y redacción publicitaria, y encontrar mejores materiales en Internet. A menudo deberías ver algunos materiales de redacción pagados descargados de Baidu Wenku, etc. A veces, solo puedes confiar en tus propias manos para escribir. sacar el formulario. Puede utilizar la función de “reconocimiento de texto” incorporada de WeChat para identificación.

Insertar descripción de la imagen aquí

(3) Pago:

Antes del pago con códigos QR con teléfonos móviles, la gente todavía pagaba en efectivo, pero ahora la gente paga con teléfonos móviles en las calles y callejones, este nuevo método de pago ha entrado en nuestras vidas y poco a poco es aceptado por el público. Luego abrimos Escanear y escaneamos el código QR del comerciante o particular para identificar ¿quién es? Incluso el pago con código de escaneo de reconocimiento facial más avanzado, estos son en realidad los métodos más utilizados en los escenarios de aplicación de OCR.

(4) Bicicletas compartidas:

Mi trabajo está relativamente cerca de la empresa, por lo que escaneo bicicletas compartidas y viajo de ida y vuelta todos los días. Usar WeChat para escanear códigos QR en bicicletas compartidas también es un escenario de aplicación de OCR.

Insertar descripción de la imagen aquí

El siguiente es un resumen de los escenarios de aplicación de OCR en la vida:

Insertar descripción de la imagen aquí

A continuación, combine el negocio de la empresa y optimice el proceso para lograr el ahorro de energía, la reducción de costos y la mejora de la eficiencia de la empresa.


3. Negocio de la empresa:

La empresa se dedica a negocios relacionados con mascotas. La empresa cumple con su misión de proporcionar alimentos nutritivos, saludables y seguros para mascotas y se centra en la investigación, desarrollo, producción y venta de alimentos para perros y gatos.
Insertar descripción de la imagen aquí

4. Los puntos débiles del negocio de la empresa:

En la actualidad, la tecnología OCR se está utilizando ampliamente. Tencent Cloud Text Recognition es una tecnología que utiliza OCR, que puede ayudar a las empresas a resolver algunos puntos débiles del negocio y aumentar la eficiencia y reducir los costos para la empresa.

1. Escenario empresarial:

  • Escenario 1: el vendedor de promoción local de la empresa debe ir a la tienda de mascotas para registrarse y autorizar a la tienda a vender los productos de la empresa y ampliar los clientes de la empresa. El departamento de servicio al cliente de la empresa necesita específicamente revisar la información enviada por la promoción local del vendedor. Al mismo tiempo, también realiza evaluaciones para la evaluación empresarial.

  • Escenario 2: Después de la compra, el proveedor debe presentar la factura a la empresa.

Insertar descripción de la imagen aquí

2. Puntos débiles del negocio:

  • Cuando se autentica un comerciante, la licencia comercial cargada debe revisarse manualmente, lo cual requiere mucha mano de obra y es una tarea muy aburrida y repetitiva.
  • Una vez enviada la factura, el personal financiero debe revisarla manualmente, que a menudo trabaja horas extras.
  • Al ampliar la mano de obra + las horas extras, los costos laborales de la empresa aumentarán.

Insertar descripción de la imagen aquí

Reduzcamos los costos operativos financieros del servicio al cliente mediante la práctica del reconocimiento de texto en Tencent Cloud.


5. Práctica de reconocimiento de texto de Tencent Cloud:

El reconocimiento de texto basado en la tecnología de aprendizaje profundo de Tencent Youtu Lab reconoce de forma inteligente el contenido del texto de la imagen y lo convierte en texto editable. OCR admite el reconocimiento de texto impreso para tarjetas y billetes, como tarjetas de identificación y tarjetas de visita, así como el reconocimiento de texto escrito a mano, como cartas de porte. Admite la prestación de servicios personalizados y puede reemplazar eficazmente la entrada manual de información.

Insertar descripción de la imagen aquí

El reconocimiento de texto basado en la tecnología de aprendizaje profundo de Tencent Youtu Lab ofrece grandes ventajas sobre otros productos a la hora de seleccionar productos.

Basado en la tecnología de aprendizaje profundo y datos masivos de desarrollo propio de Tencent, proporciona servicios de reconocimiento de texto para diversos escenarios y tipos, como tarjetas, billetes, caracteres impresos y escritos a mano, y plantillas personalizadas.

Insertar descripción de la imagen aquí

Tencent Cloud OCR es un excelente servicio de reconocimiento de texto con las características de alta precisión, baja tasa de error, reconocimiento rápido, etc., y se puede aplicar a diferentes escenarios. El uso de Tencent Cloud OCR puede ayudarnos a procesar rápidamente información de texto en imágenes y mejorar la eficiencia del trabajo, y se ha utilizado ampliamente.

1. Abrir productos relacionados:

Se puede ver que Tencent Cloud tiene muchos productos OCR, que pueden usarse ampliamente en muchos campos y convertirse en una herramienta auxiliar para una productividad eficiente.

Insertar descripción de la imagen aquí

Para probar los dos escenarios mencionados en este artículo, se selecciona el tipo "Reconocimiento de texto universal".
Insertar descripción de la imagen aquí

Marque "He leído y acepto" para activar la función del producto de reconocimiento de texto.

Insertar descripción de la imagen aquí

Recuerde utilizar el registro con nombre real para su cuenta; de lo contrario, se le solicitará que utilice el registro con nombre real. Después de pasar la revisión, puede ver que hemos lanzado el "Servicio de reconocimiento de texto" por primera vez. Cada paquete de recursos tiene una serie de obsequios, lo que nos permite realizar investigaciones y pruebas sobre el producto, lo cual es muy considerado.

Insertar descripción de la imagen aquí

La primera activación le brindará 250 oportunidades gratuitas y hay 9 tipos de activación, que pueden probarse de manera flexible según sus propias necesidades comerciales.

Insertar descripción de la imagen aquí

2. Prueba gratuita:

La familia de productos de reconocimiento de texto Tencent Cloud incluye servicios como reconocimiento general de texto, reconocimiento general de tarjetas, reconocimiento de facturas y documentos, mejora de imágenes de texto, reconocimiento estructurado inteligente, escaneo inteligente y reconocimiento de escenas específicas. Después de la activación, puede disfrutar 1000 veces al mes de forma gratuita. Monto de la llamada.

Insertar descripción de la imagen aquí

3. Experiencia de principiante:

El funcionario proporciona una variedad de formas, según las cuales puede elegir el método de uso adecuado.

Insertar descripción de la imagen aquí

4. Demostración de la experiencia de reconocimiento de texto en línea:

Simplemente haga clic en "Cargar archivo local", seleccione una licencia comercial, realice un análisis en línea y vea los resultados del reconocimiento.

Insertar descripción de la imagen aquí

5. Llame visualmente al servicio de reconocimiento de texto: herramienta de depuración oficial:

Primero pruebe con la herramienta de depuración en línea proporcionada en el sitio web oficial para ver el efecto. En "Generación de cadena de firma", haga clic en "Ver clave" para ver la ID y la clave.
Insertar descripción de la imagen aquí

Verifique el ID de API y la clave. Si se muestra la clave, debe verificarla por SMS.

Insertar descripción de la imagen aquí

En "Llamada en línea", complete los parámetros de entrada con imageUrl y la cadena de firma recién generada, haga clic en "Iniciar llamada" y podrá ver que el resultado de la respuesta ha devuelto datos.

Insertar descripción de la imagen aquí

6. Análisis del servicio de compilación del nodo:

Tencent Cloud OCR ha preparado oficialmente una variedad de formas de integrar rápidamente el kit de herramientas para desarrolladores (SDK) de Tencent Cloud correspondiente a esta interfaz en proyectos locales. Para demostrar la función, este artículo utiliza el marco Koa de Node para el desarrollo.

Insertar descripción de la imagen aquí

número de serie Bolsa efecto
1 también Koa es un marco avanzado para Node.js, se basa en el mecanismo de middleware de Node.js y proporciona un marco más simple y flexible para crear aplicaciones web eficientes y escalables.
2 analizador de cuerpos koa Koa-bodyparser es un middleware del marco web koa, que se utiliza para analizar el cuerpo de la solicitud en solicitudes HTTP, es decir, analizar los datos en solicitudes POST en ctx.request.body.
3 enrutador koa koa-router es un middleware de koa, que también contiene muchos middleware, que se dividen según diferentes rutas de enrutamiento a través de objetos de capa.
4 tencentcloud-sdk-nodejs El SDK utilizado para acceder a los servicios de Tencent Cloud puede ayudarle a desarrollar en Tencent Cloud utilizando el lenguaje Node.js.

1. Inicializar proyecto:

mkdir orc-test
cd orc-test
npm init
# 一路按回车即可初始化一个package.json

# 安装插件
yarn add tencentcloud-sdk-nodejs@4.0.673 koa@^2.14.2 koa-bodyparser@^4.4.1 koa-router@^12.0.0

2. Escriba el código reconocido por OCR:

const tencentcloud = require("tencentcloud-sdk-nodejs")
const OCRClient = tencentcloud.ocr.v20181119.Client

const Koa = require('koa');
const Router = require('koa-router');
const bodyParser = require('koa-bodyparser');

const client = new OCRClient({
    
    
  credential: {
    
    
    secretId: "AKIDyxpjjmxxxxxxxFdtx",   # 使用自己的id
    secretKey: "eFh0961yxxxxAQ",   # 使用自己的密钥
  },
  // 产品地域
  region: "ap-guangzhou",
})

// 实例化Koa对象 => app
const app = new Koa();
// 实例化路由对象 => router
const router = new Router();

app.use(bodyParser())

// 测试接口
router.get('/', async (ctx, next) => {
    
    
  ctx.response.body = `<h1>Hello, Koa2</h1>`;
});

function getImg(ImageUrl) {
    
    
  return client.BizLicenseOCR(
    {
    
    
      ImageUrl,
    },
  )
}

// 获取营业执照结果
router.post('/api/getBusiness', async (ctx, next) => {
    
    
  const request = ctx.request.body
  let result = await getImg(request.url);
  ctx.response.type = 'application/json';
  ctx.response.body = {
    
    "code": '200', "message": '成功', "data": result };
});

app.use(router.routes()).use(router.allowedMethods());

// 在端口3000监听
app.listen(3000);
console.log('app started at port 3000...');

3. Cree la URL de prueba:

Simplemente ingrese http://127.0.0.1:3000 de la solicitud de obtención en cartero.
Insertar descripción de la imagen aquí

4. Pruebe si la licencia comercial se puede analizar correctamente:

En cartero, ingrese http://127.0.0.1:3000/api/getBusiness en la solicitud de publicación. El parámetro de solicitud de publicación es URL. Puede ver que se puede devolver la información de la licencia comercial.

Insertar descripción de la imagen aquí

5. Pruebe si la factura con IVA se puede analizar correctamente:

Reemplace la función de análisis de imágenes de solicitud BizLicenseOCR con la función VatInvoiceOCR.

function getImg(ImageUrl) {
    
    
  return client.VatInvoiceOCR(
    {
    
    
      ImageUrl,
    },
  )
}

El nombre de este método puede referirse a lo siguiente: Diferentes tipos de imágenes utilizan diferentes métodos:
Insertar descripción de la imagen aquí

En cartero, ingrese http://127.0.0.1:3000/api/getBusiness en la solicitud de publicación. El parámetro de solicitud de publicación es la URL. Puede ver la información que puede devolver la factura con IVA.

Insertar descripción de la imagen aquí

6. Resumen:

La siguiente es mi experiencia de 0 a 1, desde el inicio hasta la práctica. Me tomó menos de media hora completar todo el proceso de experiencia de OCR. Puedo sentir que los productos de Tencent Cloud son realmente simples y fáciles de usar. Al mismo tiempo , También completé los requisitos para licencias comerciales, Se completa un relevamiento de facturas con IVA.

Insertar descripción de la imagen aquí

7. Comparación antes y después de las medidas de mejora:

Insertar descripción de la imagen aquí


6. Ingresos estimados por importaciones:

Insertar descripción de la imagen aquí

  • El uso de la función de reconocimiento de texto OCR de Tencent Cloud puede simplificar enormemente el flujo de trabajo empresarial.
  • Se cambia la anterior operación puramente manual a un mecanismo de revisión automática, siendo revisadas manualmente aquellas que no puedan ser identificadas o estén mal identificadas.
  • Facilita enormemente la carga de trabajo del personal financiero y de atención al cliente, que ya no necesitan cargar computadoras después del trabajo.

Hicimos una evaluación estimada de la estrategia de reducción de costos de la empresa, el costo laboral se redujo en aproximadamente un 30% y la eficiencia del trabajo mejoró en más del 50%, se ha convertido en un servicio público básico y habrá nuevos escenarios de negocio en el futuro Puede estar en línea rápidamente.

Por supuesto, la investigación debe realizarse en función de la situación real de la empresa. Por ejemplo, si el costo de adquisición es mucho mayor que el costo de la mano de obra, es posible que sea necesario medirlo.


7. Resumen:

La madurez de la tecnología OCR ha facilitado la edición de contenido en la era de los gráficos y el texto. Para escenarios comerciales que a menudo tratan con texto e imágenes, las herramientas de extracción y reconocimiento de texto basadas en la tecnología OCR son herramientas indispensables para mejorar la eficiencia.

En la era de la sociedad de la información, todos los días se genera una gran cantidad de facturas, formularios y datos de documentos. Si se desea transformar estos datos del procesamiento manual a información electrónica, es necesario extraerlos e ingresarlos mediante tecnología OCR.

Supongo que te gusta

Origin blog.csdn.net/wanmeijuhao/article/details/132881083
Recomendado
Clasificación