El periodista Brian Krebs ha demostrado esta semana la existencia de un extraño fallo en Google Translate. Este suceso tendría que ver con Lorem Ipsum, el texto que se usa habitualmente en los borradores de diseño para probar cómo quedará el contenido final con un tipo de letra u otro. Al parecer, hasta hace poco, podría haber sido un lenguaje secreto entre espías.
Originariamente, este texto viene de un fragmento en latín de un libro de la literatura clásica escrito en el año 45 a.C por Cicerón. Los desarrolladores lo tomaron prestado para usarlo de relleno estándar.
A continuación, os mostramos un fragmento del mismo: «Lorem ipsum dolor sit amet, elit adipiscing consectetur. En augue sapien, nec tempor dignissim vel, varius en tellus. Fusce no massa no sem feugiat condimentum en en magna». Como podéis comprobar, las primeras dos palabras son las que dan nombre al famoso texto.
Pero, ¿Qué podría estar pasando aquí? Sabemos que Google Translate trabaja con varias traducciones colaborativas de Internet. Por ejemplo, no traduce literalmente muchas frases que en otros idiomas porque perderían su significado. En lugar de eso, hace una búsqueda de traducciones previas y las ofrece en tiempo real.
Así, asumiendo que hay millones de páginas en la red escritas en múltiples idiomas, actúan como una Piedra de Rosetta que permite a Google librarse de la parte pesada de la traducción automática.
Por algún motivo, frases completas del «Lorem Ipsum» aparecían traducidas como NATO (en español, OTAN). En cuanto a la traducción de las dos primeras palabras, la traducción que proponía Google era China.
La explicación que da la compañía de Mountain View a todo esto es que quizás millones de páginas chinas tenían traducciones en inglés inexistentes, por lo que en ese espacio estaba relleno con el texto Lorem Ipsum. Esto podría significar que varias páginas asiáticas contenían un texto que comenzaba con la palabra “China” en su versión original.
Además, tenían una versión traducida en la que el texto no estaba escrito y se había utilizado el famoso «Lorem Ipsum». Google vio que la primera palabra en la versión original era «China» y que las primeras palabras eran «Lorem Ipsum». Así, asumió que China significaba Lorem Ipsum en inglés.
Pero Krebs no está tan seguro de esta explicación de Google. Él y sus compañeros expertos seguridad han trabajado para tratar de traducir todas las permutaciones del termino, aunque sin ningún resultado. Unos días después de notificárselo a la multinacional, las traducciones fueron “corregidas”.
En cualquier caso, probablemente nunca conozcamos la explicación real. Justo antes de la medianoche del 16 de agosto, Google Translate dejó súbitamente de traducir la palabra Lorem como algo que no fuese Lorem.
Aún así, el traductor de la multinacional aún produce resultados peculiares cuando se traduce del Latín a Inglés. Un portavoz de Google dijo que el cambio se había hecho para corregir un fallo en el algoritmo de traducción (equiparando Lorem ipsum con un texto sin relación en inglés), en lugar de hablar de una vulneración de seguridad.