Como extraer el texto de una imagen


A veces puede suceder que una imagen contiene una cantidad apreciable de texto y de alguna manera nos gustará extraerlo u obtenerlo, sin necesidad de volverlo a mecanografiar en su totalidad.

Una manera de hacerlo es mediante OCR (o ROC), que es Reconocimiento óptico de caracteres.

Vamos a utilizar en este caso el programa de Microsoft Imaging, que se ofrece gratuitamente con el sistema operativo Windows. Igualmente podría servir cualquier programa OCR.

Este programa utiliza imágenes de formato tif, por lo que si la imagen no tiene este formato, debemos antes convertirla al mismo. Una posibilidad gratuita y rápida es a través del programa Paint, que se ofrece gratuitamente con el sistema operativo Windows. Abriremos el programa y pincharemos en Guardar como. Puede servir otro programa de tratamiento de imágenes como Photoshop o Gimp.

Una vez abierto la imagen en Imaging, haremos click en Enviar texto a Word, abriéndosenos este programa con el texto de la imagen.


Si la imagen no es muy clara o nítida, el texto puede contener errores, que se suelen repetir para determinadas letras o sílabas, por lo que si el texto es largo podemos arreglarlo con el programa de texto a través de las funciones Buscar y Reemplazar.

Compartir
    Blogger Comentarios
    Facebook Comentarios

0 comentarios:

Publicar un comentario