Computacion

Ξ 42 comentarios

Cómo extraer texto de una imagen

por ToPHeR
Cómo extraer texto de una imagen

Hola amigos de CómoLoHago,  mas de alguna vez nos ha pasado que hemos escaneado algún documento o libro y deseamos editar su contenido, pero lamentablemente tenemos el texto del libro en formato imagen (Jpg,Gif, etc …) o simplemente con nuestra cámara de fotos le sacamos fotos a texto.

Es por eso que luego del salto les mostraremos 2 alternativas para convertir esas imágenes en texto y así poder editar la información.

Cómo extraer texto de una imagen

Utilizaremos el método conocido como OCR que sus siglas corresponden a Optical Charater Recognition, o en su traducción, reconocimiento óptico de caracteres.

Para lograr esto utilizaremos el software FreeOCR V3 el cual puedes descargar desde el siguiente enlace.

Si bien, el programa es gratis, este no es tan bueno ni exacto como los programas de pagados como el ABBYY FineReader (el cual trae una versión trial por 15 días o 20 impresiones).

Una vez descargado, procederemos a instalar la aplicación, lo cual no nos traerá ningún inconveniente.

Ahora ejecutaremos nuestra aplicación y tendremos una interfaz como la siguiente.

Luego de abrir el programa instalaremos el idioma ESPAÑOL, ya que por defecto viene en Ingles. Para esto descargaremos el siguiente archivo, luego descomprimiremos el archivo y pegaremos su contenido en la carpeta C:\WINDOWS\tessdata  y reiniciamos nuestro programa.

Seguido a esto haremos click en OPEN y elegimos la imagen a la cual deseemos extraer el texto.

Ahora solo nos resta marcar la opción OCR y esperaremos a ver los resultados.

En lo personal el programa no es de mi total agrado,  ya que este  falla bastante al no detectar 100% un tipo de fuente predefinida,  es por eso que a continuación les traemos otra opción, más simple y rápida.

Nuestra segunda opción es un servicio Web, al cual podemos ingresar por la dirección: http://www.free-ocr.com/ en donde nos encontraremos con la siguiente página.

En donde marcaremos examinar, donde elegiremos la imagen a transformar en texto, luego escogemos el idioma, rellenamos el sistema de seguridad (re-captcha) y haremos click en “Send File”.

Esperamos unos segundos y se desplegara una nueva pantalla con el texto extraído de la imagen que seleccionamos anteriormente.

Por último les traemos una tercera y cuarta  opción, las cuales también son  servicios Web. Se trata de http://www.ocrterminal.com/, un sitio en el cual debemos registrarnos y se nos permitirá “scannear” hasta 20 páginas gratis, para luego cobrarnos por volumen mensual “scanneado”. Por último el sitio http://www.newocr.com/ el cual es muy similar al Free-Ocr y es completamente gratis.

Con esto me despido, sin antes recordarles que este tutorial ha sido…

Cualquier duda o comentario que puedan tener, pueden realizarlos en el área habilitada a continuación.

Esperamos que este tutorial les haya sido de utilidad.

Será hasta una próxima oportunidad.

Comparte este tutorial

El culpable de todo esto

Topher se ha ganado con sudor, lágrimas y productos naturales una maestría en Tragos y Cocina. Sin embargo, no todo ha sido laureles en la vida de este calvo generador de contenidos. Luego de ser elegido Alcalde de Ciudad Gótica, tuvo que pagar el costo de ser una personalidad pública, ligado a las más diversas figuras de la farándula nacional e internacional. Debido a eso, se sometió a una costosa e innovadora cirugía de implantes de rodilla con el fin de crecer 32,5 cms y poder subirse a la montaña rusa de Felicilandia en donde compartió asiento con Xabadu, quien lo reclutó para CLH en donde, a pesar de mantener un bajo perfil, tiene a la mitad de México demandándolo por la Michelada.

En los barrios marginales se le conoce como: ToPHeR

Comentarios en Facebook

42 Comentarios

  • La tal Irene también me mandó correo a mi, cuidado ToPHeR.

  • Nada aun espero que nada les pasara y que en eun tiempo puedan volver con sus tutoriales

  • Definitivamente murió el sitio? como para sacarlo de mis favoritos?

  • He seguido su sitio desde el 2009 y me ha encantado muchos tutoriales suyos..
    ¿Que ha pasado?
    No quiero pensar lo del sismo..

  • genial, gracias

  • saludos, felicitaciones muy bueno
    me gusta dibujar con photoshop pero me falta tecnica si alguien me puede ayudar se lo agradesco les saluda jucas
    jucas_2004@yahoo.es

  • Gracias, estoy escaneando un libro, el cual es de pago y caro, y pretendo pasarlo a texto digital para el consumo GRATUITO de la comunidad que quiera leerlo, ya que el conocimmiento no deberia venderse, asi como lo hace con la educacion en chile.

    Una recomendación, no sigan sus leyes, no les den mas poder, darle la espalda y simplemente ignorenlos.

    V of vendetta.

    Saludos desde madrid

  • GT Text és también bastante bueno
    http://gttext.googlecode.com

    Le puedes añadir el español
    para que extraiga textos en español
    Recomendado

  • GT Text es también muy recomendado
    http://gttext.googlecode.com

    Saludos

  • Hola amigo tu crees q hay la posibilidad de codificar un OCR desde cero es q tenemos un proyecto de fin de curso y estoy averiguando la manera de como hacer eso gracias de antemano…

1 2 3 4 5

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Gente linda que nos quiere

Donde mas estamos