Análisis del contenido de facturas

Introducción

Un documento pdf puede ser básicamente de dos tipos:

  • Documento. Documento generado mediante exportación a pdf desde word, excel o cualquier otro software de edición. Este documento contiene una capa con la imagen y otra capa con el texto incluido en dicha imagen.

  • Archivo de sólo imagen. Se trata del archivo generado mediante el escaneado de un documento. Aunque tenga la extensión pdf, contiene únicamente la imagen, sin la capa de texto. En este tipo de documentos es imposible extraer información en texto.

La extracción de datos de facturas a partir de plantillas PDF de Adminet puede realizar el análisis automático de facturas, únicamente desde archivos pdf de tipo documento. Los que sean archivo de sólo imagen deberán ser identificados a través de la IA o manualmente por el usuario.

Si se tiene contratada la extracción de datos de las facturas mediante la IA, Adminet combina la extracción de los datos de la capa de texto con el análisis e interpretación visual del documento para obtener una mayor precisión en la obtención de los datos, pudiendo incluso obtenerlos en el caso de que se trate de un documento escaneado.

Funcionamiento

Cuando una factura es guardada en la carpeta Facturas a identificar, queda asociada al industrial que la remitió, ya sea por identificación automática del correo del remitente o por indicación manual del usuario.

El Análisis del contenido de facturas es un subproceso de la identificación de facturas mediante plantillas. Se ejecuta factura por factura y contrasta los datos de la capa de texto del documento pdf con las plantillas de facturas pdf del industrial al que está asociada la factura, por orden de creación, hasta que encuentra una con la que puede identificar todos sus valores sin ningún error. Los valores asociados son guardados en la carpeta Facturas a identificar, junto al documento.

01.png

Haga clic aquí para ver cómo configurar una plantilla de factura en pdf.

Haga clic aquí para más información sobre la identificación de facturas mediante plantillas.