Materia, la web de noticias de ciencia

Lee, piensa, comparte

El gallego, el euskera y el catalán están en peligro de extinción digital

La red europea META-NET alerta frente al peligro que supone para las lenguas minoritarias la falta de adaptación tecnológica a la sociedad de la información

Más noticias de: lenguas

ebook Ampliar

La digitalización de gran cantidad de textos es esencial para las tecnologías del lenguaje / david__jones

LEER
IMPRIMIR

Las nuevas tecnologías han proporcionado nuevos espacios para la expresión de culturas minoritarias, pero su capacidad homogeneizadora también pone en peligro la diversidad. Sobre este riesgo alerta el último informe de META-NET, una red europea formada por 60 centros de investigación de 34 países creada para ayudar a poner los cimientos tecnológicos de una sociedad de la información europea multilingüe.

Según esta serie de 31 libros blancos, que se presentan mañana, Día Europeo de las Lenguas, 21 de los 30 idiomas europeos analizados están en peligro de extinción digital. Esto incluiría al gallego, el euskera y el catalán, que no cuentan con las herramientas automáticas de traducción, procesado de textos o reconocimiento de voz lo suficientemente desarrollados como para mantener una presencia significativa en el ámbito digital.

El castellano está en mejor situación que el alemán o el francés gracias a su presencia global

La tecnología lingüística produce software capaz de procesar el lenguaje humano. Algunos de los ejemplos más conocidos son correctores ortográficos y gramaticales, asistentes interactivos para móviles (como Siri en iPhone), sistemas de diálogo telefónico, traductores automáticos, motores de búsqueda web y las voces sintéticas utilizadas por los sistemas de navegación GPS.

En España, “tenemos dos situaciones muy diferentes”, explica Asunción Moreno, investigadora de la Universidad Politécnica de Cataluña y coordinadora de la parte española del informe. “Por un lado está el castellano, que está en una situación muy buena porque es una lengua global y en EEUU hay muchas compañías que tienen sistemas de traducción o de procesamiento del lenguaje que tienen como objetivo el español”, cuenta. “Tenemos el ejemplo del Siri, que está en castellano justo después del inglés”, añade. ”Esto le da un impulso que no tienen ninguna de las demás lenguas europeas salvo el inglés, ni siquiera el alemán o el francés”, concluye Moreno.

Del resto de lenguas cooficiales, el catalán sería la que se encuentra en mejor situación. Gracias al apoyo de los gobiernos, tanto de la Generalitat de Cataluña como de la Generalitat Valenciana y de los equipos de muchas de sus universidades, han desarrollado tecnologías que se han empleado para facilitar la adaptación de esta lengua al entorno digital. Esto ha permitido que en algunos parámetros supere a lenguas de países como Bulgaria o Grecia. Tanto el euskera como el gallego se encuentran en una situación algo peor, aunque aún así obtienen mejores resultados que el lituano, el islandés o el maltés.

21


Número de lenguas europeas que están en peligro de extinción digital

“El euskera no va a desaparecer, pero el que no haya un buen traductor para utilizarlo en el móvil o en documentos oficiales, por ejemplo, hace que al final su uso se vaya a restringir al ámbito familiar”, opina Inmaculada Hernaez, la investigadora de la Universidad del País Vasco que se ha ocupado del informe sobre el euskera.

Las aplicaciones de tecnología lingüística se basan fundamentalmente en métodos estadísticos, que requieren cantidades muy grandes de datos. Obtenerlos resulta particularmente difícil para los idiomas pequeños, y eso revierte en la escasa calidad de muchos sistemas estadísticos, como puede verse, por ejemplo, en las traducciones, a menudo absurdas, producidas por los sistemas de traducción automática en línea para algunas lenguas. El euskera, por ejemplo, es un idioma con pocos hablantes, muy distinto de casi todas las lenguas europeas y que además ha tenido una normalización reciente, una serie de circunstancias que incrementan los problemas a la hora de encontrar textos para ayudar a las aplicaciones a “aprender el idioma”.

Cooperación entre instituciones

Por este motivo, es muy importante la colaboración entre las instituciones que pueden aportar los datos y el conocimiento necesarios para desarrollar las tecnologías lingüísticas, particularmente en los idiomas más débiles. Las responsables de los informes de las lenguas de España aseguran que esta colaboración existe, particularmente intensa y fructífera en el caso del catalán. Llama la atención que, según comenta Maite Merlo, investigadora de Barcelona Media y responsable del informe sobre el castellano, precisamente esta voluntad para compartir las grandes cantidades de textos necesarios sea menor en el caso del castellano. “La RAE ha dedicado un esfuerzo importante para digitalizar su patrimonio, pero en ocasiones la cooperación con las instituciones que pueden proporcionar estos textos no ha sido todo lo fluida que debería”. Posiblemente, plantea Merlo, la sensación de idioma minoritario hace que se vea como más necesaria la cooperación.

Además de la cooperación entre instituciones, Nuria Bel, responsable del informe sobre el catalán, menciona algunos aspectos de regulación que pueden servir para incentivar la pluralidad lingüística. “Mientras que en España no puede entrar un teclado que no tenga la ñ, sí puede entrar un corrector de textos que no tenga aplicación para el catalán, y este tipo de factores son importantes”, señala Bel.

«El euskera no va a desaparecer, pero su uso se podría restringir al ámbito familiar»


Inmaculada Hernaez
Investigadora de la Universidad del País Vasco

El informe de META-NET busca concienciar sobre la necesidad de prestar atención al desarrollo de las tecnologías lingüísticas. Por un lado, para avanzar en la construcción de un mercado digital único, que mejore la libre circulación de bienes, productos y servicios, pero también por el interés propio de la diversidad lingüística y cultural europea. Para lograrlo, los responsables políticos y las empresas deberán aprender a valorar unas tecnologías que son costosas pero, según los autores de estos informes, necesarias y rentables.


REFERENCIA

http://www.meta-net.eu/whitepapers


Archivado en: lenguas




COMENTARIOS