Leyendo noticias: NessieOCR
Las primeras empresas que comenzaron prestando el servicio de seguimiento de medios recurrieron a la figura del documentalista, una persona que se sentaba a hojear páginas de periódico para recortar los artículos y clasificarlos en archivadores para su posterior entrega por correo o un medio similar. Pronto se dieron cuenta de que el modelo se quedaba obsoleto a medida que el número de medios a cubrir crecía.
El proceso manual fue evolucionando progresivamente con la introducción de escáneres y otros dispositivos electrónicos, hasta que actualmente las empresas de seguimiento de medios demandan sistemas informáticos que ofrezcan niveles de velocidad y fiabilidad cada vez mayores.
No resulta difícil entender que las técnicas de reconocimiento óptico de caracteres (OCR), son una herramienta fundamental dentro de todo el proceso de automatización. A fin de cuentas es el mecanismo que permite traducir las imágenes en palabras, rescatando el contenido que verdaderamente interesa al cliente.
El reconocimiento óptico de caracteres es el resultado de aplicar de manera específica técnicas de clasificación de patrones, una disciplina que representa un eje fundamental dentro de la inteligencia artificial y la visión por computador. Identificar patrones observando características de los sujetos es una tarea que el ser humano tiene perfectamente automatizada a través de su compleja red sensorial, sus mecanismos de abstracción y su extraordinaria capacidad de razonamiento. Gracias a ellos hemos conseguido sobrevivir a lo largo de toda nuestra existencia. Dotar a una máquina de ese comportamiento constituye una tarea cuanto menos ambiciosa y compleja, pero en un dominio más reducido ciertos mecanismos sí pueden ser imitados.
Una de las aplicaciones más inmediatas de los OCR consiste en aumentar el rendimiento de procesos industriales, o evitar en mayor o menor medida la inversión de recursos humanos en tareas que son tediosas, monótonas o muy sencillas de realizar. Por ejemplo, supervisar la impresión de la fecha de caducidad en una cadena de producción de latas de refresco se convertiría en un proceso muy lento si fuera llevado a cabo por un operario. Tampoco resulta rentable colocar a un vigilante a la entrada de un aparcamiento sólo para anotar las matrículas de los vehículos, cuando puede hacerlo un sistema controlado de cámaras automáticamente.
NessieOCR es la parte del proyecto Nessie que se encarga de las operaciones básicas de reconocimiento de caracteres, como punto intermedio entre la segmentación y la clasificación de noticias:
- El módulo de segmentación alimenta a NessieOCR con un conjunto de imágenes que contienen texto.
- NessieOCR procesa cada imagen, identificando caracteres y construyendo bloques de texto. Además, añade información adicional sobre las características del texto (formato, número de caracteres, altura,…).
- Cada bloque de texto es transferido de nuevo al módulo de segmentación, que los agrupa según la noticia a la que pertenecen y los traslada al módulo de clasificación.
La detección de caracteres en fuentes tipográficas se considera un problema resuelto en la mayoría de sus aspectos, mientras que los manuscritos presentan una mayor problemática. Aunque en ámbitos académicos se siguen realizando investigaciones para desarrollar nuevos métodos o plantear mejoras a los existentes, la realidad es que la industria se ha centrado más en la implementación de las técnicas de éxito contrastado, haciendo hincapié en aspectos como la rapidez o la tasa de acierto.
08. Sep, 2010 







No comments yet... Be the first to leave a reply!