¿Google Translate contiene un algoritmo secreto?

El periodista de investigación estadounidense Brian Krebs demostró esta semana la existencia de un curioso fenómeno de Google Translate relacionado con la traducción de las palabras latinas 'lorem ipsum' al inglés.

'Lorem ipsum' son dos palabras que forman parte de un texto que se usa en diseño gráfico para comprobar el aspecto de las tipografías y las maquetaciones en fases previas antes de añadir el texto definitivo. Se extrajo de una pieza clásica de la literatura en latín escrita en el año 45 a. C. por Cicerón, aunque se le introdujeron modificaciones.

Resulta que al intentar traducir las palabras 'lorem ipsum' del latín al inglés la aplicación de Google dio como resultado términos relacionados con la geopolítica, como por ejemplo 'NATO' (OTAN es español), o 'China'. Al introducir en Google Translate diferentes combinaciones de las palabras 'lorem ipsum', o al cambiar su orden o escribirlas con mayúsculas iniciales, se obtuvieron traducciones como 'lanzamientos de China', 'vehículos y técnica', 'juegos', 'tecnología' y mensajes similares. Todo esto hacía sospechar que Google Translate podría contener un código que permitiese descifrar mensajes encriptados y cuya función sería traspasar el control y la censura de Internet en China.

Poco después de que Krebs publicara su artículo, Google modificó la traducción del algoritmo producido por esta palabra y actualmente es completamente imposible obtener los resultados que Krebs mostró, ya que ahora al intentar traducir 'lorem' del latín al inglés Google Translate no da como resultado la palabra 'China', sino simplemente 'lorem'. Google replicó rápidamente en su Twitter para asegurar que su traductor "funciona correctamente y es seguro. Suelen suceder cosas así cuando traduces tonterías". Sin embargo, el periodista considera que "detrás de todo esto hay algo más que simples resultados fortuitos por el hecho de traducir ciertas palabras al azar. Existe un propósito mayor que no hemos logrado todavía descubrir".


Una teoría relaciona la manera como se escribe el texto con un algoritmo usado por el traductor automático. Google Translate busca en una vasta base de datos de texto para encontrar patrones y compararlos para ofrecer la mejor traducción. Algunos de los textos en los que se basa son documentos de las Naciones Unidas y de la Unión Europea, algunos de ellos escritos en latín.

Otra suposición es que los responsables de estas curiosas traducciones podrían ser los programistas envueltos en el proyecto DefCon Badge, una comunidad de Internet que invierte horas en piratear otros proyectos y rompecabezas. Aunque también es probable que la explicación más sencilla sea la correcta; es decir, que el traductor de Google no es una herramienta perfecta y que, como todo programa informático desarrollado a partir de lenguajes de programación, tiene errores y comportamientos inesperados que sus programadores solucionan a medida que los detectan.