Como proyecto académico de lanzamiento profesional, Transnuance ofrece traducciones de calidad de inglés y francés a español, así como revisiones de textos en español (originales y traducciones).

29 de noviembre de 2012

TEXTOS NO EDITABLES

A menudo, los traductores recibimos encargos en los cuales el cliente nos envía textos en formato no editable, como por ejemplo en .pdf (muy habituales) o en algún formato de imagen, como .jpg, .png o .gif. Estas son las circunstancias de nuestro primer encargo. ¿Qué opciones tenemos para trabajar con este tipo de textos?

En primer lugar, no es una idea en absoluto descabellada preguntarle al cliente si no dispone del texto en otro formato. Puede parecer una obviedad, pero en numerosas ocasiones el cliente no se detiene a pensar en este aspecto tan decisivo para el traductor y, como el .pdf es un documento final con una apariencia mucho más profesional que el .doc(x), opta por enviarnos el primero.

En caso de que no lo tenga o de que no queramos preguntarle por las circunstancias que sea, tenemos la posibilidad de transcribir el texto manualmente. Este proceso es una opción siempre y cuando nos encontremos ante un documento breve; en cualquier otro caso, es inviable por el tiempo y el esfuerzo que requiere.

La tercera posibilidad es recurrir a un programa de OCR (reconocimiento óptico de caracteres). Aunque el texto de nuestro encargo se encuentra en internet, hemos seguido este procedimiento como práctica y para cerciorarnos de la fiabilidad de estos programas.

El programa que hemos utilizado es FreeOCR 4.2. Se trata de un software gratuito, pero no por ello ofrece resultados de peor calidad. La interfaz es sencilla y fácil de usar: la pantalla se divide en dos secciones, con el documento cuyo contenido queremos obtener en la mitad izquierda y el texto que la aplicación extrae (junto con las instrucciones de uso) en la mitad derecha. Basta con seleccionar la parte que deseamos procesar o el texto completo y pulsar sobre el botón OCR. Podemos elegir entre trabajar con la página actual o con todo el documento, si consta de varias páginas. El proceso apenas dura unos segundos.


Pulse sobre la imagen para ampliarla
El resultado, en el caso de nuestro texto, ha sido bastante satisfactorio. La mayor parte de los errores que aparecen en el texto extraído se deben bien a la calidad de la imagen, bien al tipo de letra, que lleva al programa a confundir algunos caracteres y símbolos, o bien a la división de palabras en dos líneas, puesto que el texto con el que vamos a trabajar está en columnas.

No obstante, como ya se ha mencionado más arriba, hemos localizado una versión en línea del mismo texto, exactamente igual que el que nos ha proporcionado el cliente, por lo que hemos decidido emplearla para preparar el presupuesto y hacer la traducción.

1 comentario:

  1. Chicas, os queríamos dar las gracias por compartir con todos las herramientas que habéis utilizado para solventar problemas que os han ido surgiendo en los encargos. En especial, este programa de OCR, que os pedimos permiso para emplear nosotras también.
    Enhorabuena por la página.
    Saludos

    ResponderEliminar

Related Posts Plugin for WordPress, Blogger...

Etiquetas