Conversando con Samuel Frontull

Conoce a los innovadores: Samuel Frontull, creador de un sistema de traducción automática para promover el ladino

Samuel Frontull, investigador de 28 años de la Universidad de Innsbruck (Austria), ha creado el primer sistema de traducción automática para el ladino, una lengua minorizada hablada por unas 30.000 personas en las regiones de Tirol del Sur, Trentino y Belluno, en el norte de Italia. Su herramienta, accesible a través de  tradutur-informatik.uibk.ac.at, permite traducir entre ladino-inglés, ladino-alemán y ladino-italiano. El trabajo de Samuel ha atraído

la atención de los medios de comunicación, lo que le ha convertido en una figura destacada de la digitalización del ladino. En esta entrevista, Samuel habla de la inspiración que hay detrás de su proyecto, de los retos de promover una lengua pequeña y de su visión del futuro de la tecnología lingüística.

Samuel, ¿podrías explicarnos brevemente qué es exactamente lo que has desarrollado y en qué beneficia a la lengua ladina?

Durante los últimos tres años, a través de un proyecto de investigación en la Universidad de Innsbruck en colaboración con el Instituto Cultural Ladino «Micura de Rü», he estado desarrollando un sistema de traducción automática para la lengua ladina. Lo enfocamos como un proyecto de investigación porque al principio no estaba claro que se pudiera crear un sistema de traducción para una lengua pequeña con recursos de datos limitados. Ahora, después de tres años de trabajo dedicado, disponemos de una herramienta en línea que puede traducir textos hacia y desde el ladino (actualmente para la variante Val Badia). Aunque esta herramienta aún se limita a esta variante específica y tiene cierto potencial de mejora, ya es práctica y puede ofrecer una orientación útil. Beneficia a la lengua ladina al permitir que los interesados se interesen por ella y al apoyar a quienes la utilizan profesionalmente, haciendo que la lengua sea más accesible y atractiva.

¿Qué le inspiró para desarrollar un sistema de traducción automática del ladino?

La idea surgió durante mis estudios en la Universidad de Innsbruck, donde propuse este tema para mi tesis final como parte del programa de formación continua «Ciencia de datos». Aunque me pareció un reto fascinante para abordarlo desde la disciplina de la ciencia de datos, en el fondo, este proyecto surgió probablemente de mi viejo deseo de hacer más visible y accesible el ladino. Es una combinación única de mi formación en informática y mi lengua materna, lo que le da un significado especial para mí. Gracias a la financiación de la Regione Autonoma Trentino-Alto Adige/Südtirol y al apoyo del Instituto Cultural Ladino «Micurá de Rü», tuve la oportunidad de seguir trabajando en él y llevarlo a su nivel actual.

¿Cómo cree que influirá su trabajo en el futuro de la lengua ladina?

Es difícil predecirlo, ya que se trata sólo de una herramienta digital. Si hubiera hecho algo para solucionar problemas como el alto coste de la vida en las zonas de habla ladina, podría decir con más seguridad que he fortalecido el futuro de la lengua. No obstante, puede ayudar a preservar el ladino y abre interesantes posibilidades para otras aplicaciones. Lo ideal sería que este proyecto inspirara nuevas iniciativas para aumentar la visibilidad y accesibilidad de la lengua.

¿Qué dificultades ha encontrado al digitalizar el ladino?

El ladino se encuentra en una posición relativamente buena porque se sigue utilizando activamente en la vida cotidiana, se promociona, está presente en los medios de comunicación, se enseña en las escuelas y se estudia en el mundo académico. Esto constituye una base importante para el desarrollo de un sistema de traducción automática, ya que garantiza la disponibilidad de recursos de alta calidad y una base de usuarios potenciales más amplia. Aun así, me enfrenté a varios retos, especialmente a la hora de recopilar y preparar los datos. Un aspecto único del ladino es su diversidad, con distintas variantes que tienen cada una sus propias convenciones ortográficas. Esta diversidad supone un reto, ya que cada variante requiere un enfoque adaptado, y hay que recopilar textos de alta calidad para cada una de ellas. En el caso de la variante Val Badia, un obstáculo importante fue la reforma ortográfica de 2015, que obligó a preprocesar los textos más antiguos para adaptarlos a las normas actualizadas.

¿Cómo han acogido su trabajo los medios de comunicación, sobre todo en Italia y Austria?

En 2021, el proyecto recibió un premio de la Fundación de la Industria del Tirol Eduard Wallnöfer, del que se hicieron eco medios locales como Rai Ladinia, Rai Südtirol, el programa Südtirol Heute de la ORF y los periódicos locales Dolomiten y La Usc di Ladins. Estos medios de comunicación han prestado un gran apoyo, proporcionando recursos de texto esenciales y mostrando un interés constante por el progreso del proyecto.

¿Qué planes tiene para el futuro de la tecnología lingüística y las lenguas minoritarias?

Se necesitan soluciones mejoradas para que las tecnologías actuales sean más eficaces con las lenguas minoritarias. La mayoría de los sistemas modernos se basan en grandes conjuntos de datos para imitar patrones lingüísticos, un método que es eficaz para las lenguas principales, pero que a menudo se queda corto en situaciones con pocos recursos. Además, adaptar estos sistemas puede resultar complicado, ya que su funcionamiento interno no es fácil de interpretar.  Las soluciones que incorporan conocimientos lingüísticos podrían permitir aplicaciones más avanzadas para lenguas minoritarias. Preveo desarrollos futuros como la síntesis del habla, el reconocimiento de voz, asistentes de escritura inteligentes, cursos de idiomas innovadores y herramientas para contar historias. Me gustaría contribuir a este viaje en curso.

Más recursos sobre la labor de Samuel: