Doonamis OCR reconocimiento óptico de carácteres
Desarrollo de Apps 18 diciembre, 2014

Las aplicaciones móviles de lectura OCR nos ayudan a identificar y gestionar el mundo que nos rodea. Vivimos en un entorno lleno de números y letras. Copiarlos manualmente es cosa del pasado, las apps móviles leen, interpretan y realizan acciones en función de ellos.

¿Pero qué es el OCR? Son las siglas de Reconocimiento Óptico de Caracteres, el proceso por el cual se escanea y digitaliza cualquier documento u objeto que contenga números o letras en un determinado alfabeto. El OCR interpreta y entiende estos caracteres, de modo que lo que guarda o procesa no es una imagen, sino datos.

¿Hablamos de ejemplos concretos?

  • Lectura OCR de contadores de gas, agua y electricidad: Aún son muchos los contadores que exigen la lectura manual por parte del usuario y su comunicación a la empresa suministradora. Por muy fácil que pongamos las cosas, nada será tan sencillo como enfocar el contador con un móvil y enviar al instante esa lectura, en formato numérico y procesable.
  • Lectura OCR de contadores de máquinas en depósito: En muchas oficinas con una potente máquina fotocopiadora, se debe llamar mensualmente para dar la lectura de las copias realizadas. El teléfono es un método poco eficaz y que roba tiempo… pero se sigue utilizando. También tienen contadores las máquinas de vending y las máquinas recreativas (o «tragaperras»). El modo más rápido para comunicar estos datos es enfocar con el móvil y enviarlos.
  • Lectura OCR de tarjetas de fidelización: Sin duda, las grandes triunfadoras de las técnicas de marketing en el comercio minorista son las tarjetas de puntos y fidelización. Pero ocupan espacio en el monedero y han surgido varias apps móviles que permiten sustituirlas por su equivalente digital. La lectura OCR permite identificar rápidamente los datos de la tarjeta y procesarla en un «monedero virtual».

[Tweet «Gestionar las tarjetas de fidelización con el móvil, posible con una app con OCR»]

  • Lectura OCR de tarjetas de visita: La mayoría de ejecutivos y comerciales ha descartado el tarjetero como medio para recordar los contactos. Lo han sustituido por las tarjetas VCard, los contactos de LinkedIn o la agenda del móvil. Pero una tarjeta física puede proporcionar datos que queramos conservar. Una app móvil con OCR permite situar la tarjeta de visita sobre la pantalla del smartphone, escanearla y procesar los datos del modo que se desee (por ejemplo, incluyéndolos automáticamente en los campos de la agenda del móvil).
  • Traducción automática de textos: Supongamos que un ejecutivo japonés nos entrega una tarjeta de visita. Automáticamente, podríamos traducirla a nuestro idioma a partir de la lectura OCR de los caracteres nipones. Y lo mismo es aplicable a cualquier otro texto escrito: folletos comerciales, prospectos de medicamentos, notas técnicas, recetas de cocina… La tecnología para hacerlo existe, la fiabilidad de las traducciones está ganando terreno y alcanzará un alto grado de perfección en pocos años.
  • Lectura de matrículas de vehículos: En un gran evento deportivo, en el que se habilitan grandes espacios al aire libre como aparcamiento, puede interesar llevar un control de los vehículos estacionados. Bastará con reconocer las matrículas con una app a la entrada al recinto, como sucede en los parkings urbanos que cuentan con cámaras OCR.
  • Lectura OCR de documentos: Ya sea para digitalización en formato texto o para personas ciegas o con visión reducida, que pueden trasladar automáticamente  con una app este texto a una locución audible.
  • Contabilidad empresarial o finanzas personales: La factura electrónica es una tendencia imparable, pero en 2014 representa solo un 8% de la facturación a nivel mundial y un 14% en Europa dirigida a ciudadanos (24% a empresas y Administraciones Públicas). Es posible agilizar el inmenso volumen de facturas en papel mediante una lectura OCR que extraiga solo aquellos datos necesarios para la contabilidad y que los incorpore directamente al ERP o software de gestión empresarial. Del mismo modo, han surgido apps móviles que permiten escanear y extraer datos de los tiquets de compra, a fin de llevar el control de las finanzas personales.

[Tweet «Una app móvil con OCR permite escanear un tiquet o factura y entenderlo, en sus aspectos más relevantes»]

  • Validación de gastos para su pago: Es una variante del punto anterior y la lleva a cabo, por ejemplo, la mutua holandesa PNOzorg. Todos los mutualistas pueden usar una app móvil para comunicar sus gastos médicos: basta con hacer una fotografía del tiquet de compra de medicamentos, por ejemplo, y enviarla. En 3 días reciben un aviso conforme ese importe les ha sido abonado en su cuenta corriente.
  • Lectura de horarios y matrices de datos: Convenientemente parametrizados, pueden ser tratados para el uso que necesitemos.
  • Indexación de datos a partir de imágenes: Efectivamente, es posible extraer los textos que aparecen en las fotografías, y cuando hablamos de grandes bases de imágenes, los datos extraídos pueden ser significativos. Supongamos un vehículo equipado con cámara, como el de Google, que recorra todas las calles de Barcelona: podría suministrarnos un directorio extenso de negocios locales en el que conoceríamos su nombre comercial (extraído del rótulo) y coordenadas de geolocalización.

Un caso real: Gas Natural

La eficiencia en las empresas depende en ocasiones de dar al usuario recursos sencillos para simplificarle la vida. Es lo que pasa con la lectura de los contadores de Gas Natural. Todos conocemos el método tradicional, por el que los usuarios deben apuntar con bolígrafo la lectura de sus contadores en una hoja colgada habitualmente en el vestíbulo del edificio.

Otros usuarios prefieren llamar por teléfono, escribir un email o tomar una fotografía del contador y enviarla por correo desde su móvil.

[Tweet «Dar al usuario recursos para simplificarle la vida aumenta a su vez la eficiencia de las empresas.»]

¿Es posible simplificar este proceso? Sí, mediante una aplicación móvil que permita realizar la lectura del contador con la cámara del móvil y enviarla. Todo desde la misma app. Eso comporta enviar al mismo tiempo el código de identificación del contador, su valor actual, la fecha y hora. Y, la guinda del pastel, permite que en destino la lectura sea procesada sin intervención humana.

Por supuesto, siempre habrá un porcentaje de lecturas que necesitarán validación humana, pero para ello ya existen los procesos adecuados. La casuística es amplia: un contador sucio o empañado, una iluminación deficiente, un ángulo de imagen que no permita reconocer los números… También son numerosos los modelos de contador y, con ellos, las distintas tipografías y tamaño de los números.

En ello estamos trabajando en Doonamis, empresa de desarrollo de aplicaciones para negocios. El proyecto es complejo:

  • Una aplicación móvil con un reconocimiento OCR potente
  • Un backoffice o escritorio para los operarios de Gas Natural, que deban analizar las imágenes borrosas y tener acceso a las validadas automáticamente, a efectos de control
  • Una integración de esta plataforma con los sistemas de gestión internos de Gas Natural, a fin de contabilizar las lecturas y proceder a la facturación

Uno de los campos de especialización de Doonamis es el reconocimiento OCR y la visión por ordenador, área a la que dedicaremos otro reportaje.

En resumen:

  1. Una aplicación móvil con lectura OCR permite escanear cualquier superficie con textos o números impresos.
  2. Una vez reconocidos, permite archivarlos y tratarlos en local, o bien enviarlos a un destino por distintos medios: cloud, SMS, e-mail, Facebook, Twitter, Evernote…
  3. La app puede permitir la traducción del texto a otros idiomas o bien su escucha mediante una locución Voice-over
  4. La app puede realizar cualquiera de las acciones imaginables para una app, a partir de haber gestionado como datos esos textos o números. 

Doonamis Apps para empresas Blog

¿Interesado en nuestros servicios?
¡Pídenos un presupuesto!

Pedir presupuesto