Conoce a los innovadores: Alexandru Jerpelea, Pionero de la Traducción Automática para Preservar el Arrumano
Alexandru Jerpelea, un estudiante de bachillerato de 17 años de Bucarest (Rumanía), ha creado el primer sistema neuronal de traducción automática para el arrumano, una lengua románica minoritaria hablada por unas 200.000 personas en los Balcanes. Su innovadora herramienta, a la que se puede acceder a través de AroTranslate.com, permite traducir entre el Arrumano-Rumano, el Arrumano-Inglés y el Inglés-Rumano. Su dedicación a la lingüística computacional ha atraído la atención nacional en Rumanía, y los medios de comunicación se han hecho eco de su impactante trabajo. En esta entrevista, Alexandru nos habla de la inspiración que hay detrás de su proyecto, de los retos a los que se ha enfrentado y de la importancia de su proyecto para la conservación del arrumano.
Alexandru, ¿podría explicarnos brevemente qué ha inventado exactamente y en qué beneficia a la lengua arrumana?
Junto con Sergiu Nisioi, de la Universidad de Bucarest, y con el apoyo de la comunidad aromana de Rumanía y de otros países -en particular con la ayuda de Florentina Costea, que me introdujo en la comunidad- creamos el primer sistema neuronal de traducción automática para el arrumano, una lengua romance oriental. El proyecto requirió la creación de un conjunto de datos de más de 80.000 pares de frases rumano-arrumano recogidas de diversas fuentes, junto con un proceso de recopilación de datos adaptado al arrumano. Esta herramienta de traducción, impulsada por la IA, pretende hacer más accesible el arrumano. Encontrará más detalles técnicos del proyecto en nuestra publicación: https://arxiv.org/abs/2410.17728.
¿En qué se inspiró para desarrollar el primer sistema de traducción automática del arrumano?
Me inspiré en mis estudios de lingüística computacional y en otros proyectos de traducción automática de lenguas en peligro de extinción, como el sami y el cherokee. Ver estos esfuerzos para otras lenguas me motivó a crear algo similar para el arrumano.
¿Qué significa para usted contribuir de forma tan significativa a la preservación de la lengua arrumana?
Estoy orgulloso de que este proyecto haya llamado la atención sobre la conservación del arrumano. Los artículos en Internet y las publicaciones en las redes sociales están ayudando a concienciar al público en general. En el mundo académico, espero que nuestro corpus inspire más investigaciones sobre la digitalización del arrumano. Aunque nuestro proyecto es un notable paso adelante, sigue siendo un prototipo con limitaciones, y el arrumano aún se enfrenta a desafíos. Aunque este proyecto por sí solo no «salvará» la lengua, espero que hayamos dado un paso en la dirección correcta.
¿Qué dificultades ha encontrado al desarrollar este sistema de traducción?
El mayor reto fue la recopilación de datos. Aunque nuestro corpus (conjunto de datos) es el mayor de su clase para el arrumano, sigue siendo bastante pequeño en comparación con las lenguas de alto nivel de recursos, que suelen tener conjuntos de datos con millones o incluso miles de millones de frases. Nuestro objetivo es ampliarlo y mejorarlo.
¿Qué reacciones has recibido de la comunidad del arrumano en relación con su invento? ¿Cómo han reaccionado los medios de comunicación rumanos ante su trabajo?
La comunidad arrumana se ha mostrado muy entusiasta y ha ofrecido comentarios constructivos sobre los errores del programa, lo cual ha sido muy valioso. Los principales medios de comunicación rumanos se hicieron eco de nuestro proyecto, lo que generó entusiasmo también entre los no hablantes de arrumano. Recibimos mensajes de personas que desconocían la situación de la lengua, y nos alegramos de haber contribuido a concienciar sobre sus retos.
¿Cuáles son sus planes para futuros proyectos relacionados con la tecnología lingüistica?
El año que viene, empezaré la universidad, donde pienso seguir estudiando PNL (Procesamiento del Lenguaje Natural) y contribuir a más proyectos para lenguas de bajos recursos. Una vez que el proceso de admisión de la universidad finalice, volveré a seguir desarrollando el sistema de traducción al arrumano.
Más información sobre la labor de Alexandru:
- AroTranslate – Sistema de Traducción Arrumana: Explore la herramienta de Alexandru, que admite las combinaciones de traducción arrumano-rumano, arrumano-inglés e inglés-rumano.
- Entrevista del medio Digi 24 (en rumano): Vea la entrevista televisiva de Alexandru, en la que comparte sus impresiones sobre el desarrollo y la repercusión de su traductor.
- Entrevista en el medio Libertatea (en rumano): Lea un artículo sobre la trayectoria de Alexandru, en el que se destacan las reacciones de la comunidad y la importancia del proyecto.