Frank, el prototipo que ha desarrollado la BBC para las traducciones automáticas de noticias

El tamaño de algunos mercados informativos nacionales obliga a los principales medios a buscar su internacionalización, primero en los países de la misma lengua en la que se escribe el periódico, pero posteriormente con ediciones concretas en idiomas extranjeros.

 

Pero, en este último caso la barrera del idioma supone un problema. Traducir todos los contenidos por parte de humanos es un coste en recursos muy elevado, y dejarlo en manos del traductor de Google u otros similares, aunque sea con cierta supervisión humana, presenta tantos fallos que afecta de manera muy negativa la imagen del periódico. Un prototipo que está desarrollando la BBC, basado en machine learning, puede ser una solución valiosa a medio plazo.

 

La BBC tiene corresponsalías y redactores que trabajan en 43 idiomas que van desde el suajili hasta el serbio. Los periodistas de cada servicio de idiomas publican en sus respectivas ediciones una combinación de su propio periodismo original y artículos que han traducido de otros servicios de idiomas.

 

Pero este proceso de traducción manual por parte de cada uno de ellos deja fuera de la ecuación todos los artículos escritos en idiomas que el redactor no entiende. Por ejemplo, un redactor del servicio de idiomas en alemán puede traducir artículos en inglés, francés u otros idiomas que domine y que le han parecido interesantes, pero quedan fuera de su control todos los artículos publicados en los idiomas que desconoce.

 

La BBC reconoce que tenía un problema con los idiomas: “La barrera del idioma y el gran volumen de historias significan que los editores no siempre están al tanto de los artículos relevantes publicados por otros servicios de idiomas. Las historias realmente buenas que serían de interés para un público más amplio pueden terminar siendo publicadas en un solo idioma”.

 

Para solucionarlo, la News Labs de la BBC se puso a trabajar, y el resultado es un primer prototipo que puede solucionar este problema, y al que han bautizado como Frank. 

 

“Nuestros ingenieros de software -explican desde la BBC- han creado una herramienta prototipo y la han llamado Frank. Es la abreviatura de lingua franca, un idioma común que se usa entre personas que no comparten un idioma nativo”. Tras los desarrollos pertinentes, ahora Frank traduce los artículos de la BBC desde cualquier idioma al inglés y luego los agrega en un panel de control en la web.

 

Pero no acaba ahí su labor: además de traducir un artículo desde el idioma original en el que está redactado al inglés, también permite que un periodista de un servicio de idiomas pueda seleccionar una historia de ese panel para que Frank la traduzca a su propio idioma. Luego, el periodista puede editar esa traducción dentro del navegador.

La BBC ya había desarrollado un prototipo anterior, el Live Page Translation, que agrega y traduce automáticamente el contenido de las breves actualizaciones de noticias en las páginas de los servicios lingüísticos, y que ha servido como aprendizaje para el posterior lanzamiento de Frank.

Frank utiliza dos servicios de traducción automática para mejorar la fiabilidad: Amazon Translate y el servicio del proyecto de colaboración de News Labs llamado Global Under-Resourced Media Translation (GoURMET), un desarrollo de IA entrenada con una gran cantidad de oraciones idénticas traducidas en los idiomas más populares.

 

El prototipo de Frank llama a estos servicios de traducción en una aplicación React escrita en TypeScript. A ello se une Depth Finder, otra herramienta para para seleccionar artículos de la BBC y filtrarlos.

 

“Agregamos un filtro para eliminar las historias que los editores digitales nos dijeron que no querían. Por ejemplo, los editores dijeron que por lo general tienen un número desproporcionado de historias sobre muerte y destrucción, pero les cuesta encontrar reportajes originales, explicativos e historias inspiradoras”, indican desde la BBC.

 

Frank está siendo probado con editores digitales que trabajan en los servicios de idiomas y, además, se están introduciendo en GoURMET todas las traducciones que los periodistas han editado. “Estos datos podrían usarse para mejorar la precisión de las traducciones posteriores”, sostienen.

 

La BBC evaluará cómo van las pruebas y dependiendo del resultado “podemos agregar más filtros. Un filtro podría resaltar historias que han demostrado ser particularmente populares entre la audiencia. Un filtro adicional podría eliminar las historias que son traducciones en sí mismas. Luego consideraremos si poner este prototipo en producción para uso general”.

 

De funcionar el desarrollo de la BBC y ser liberado o que se permita aprovechar el desarrollo, muchos periódicos podrían internacionalizarse al disponer de sus contenidos en distintos idiomas, con la calidad suficiente como para que la marca no salga perjudicada.