Marta Villegas

Marta Villegas
Información personal
Nacionalidad Española
Educación
Educada en Universidad Politécnica de Cataluña Ver y modificar los datos en Wikidata
Información profesional
Ocupación Investigadora e investigador de lingüística computacional Ver y modificar los datos en Wikidata
Empleador Centro Nacional de Supercomputación (desde 2017) Ver y modificar los datos en Wikidata
Distinciones

Marta Villegas Montserrat (Barcelona, siglo XX) es una lingüista computacional e investigadora española. Dirige la Unidad de Tecnologías del Lenguaje del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC–CNS).[1][2][3]

Trayectoria

Villegas se doctoró en Lingüística aplicada en 1998 en la Universidad Politécnica de Cataluña (UPC) con la tesis titulada Controlled subjects in Spanish and other "non-strictly local" bounded dependency constructions (Sujetos controlados en español y otras construcciones de dependencia delimitada «no estrictamente locales»), donde analiza cómo las lenguas románicas, como el español, desafían algunos principios de la teoría lingüística HPSG (Head-Driven Phrase Structure Grammar).[4]

Villegas dirige la Unidad de Tecnologías del Lenguaje del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC–CNS) donde trabaja desde 2017. Lidera el proyecto MarIA dentro del BSC–CNS, una iniciativa de acceso abierto diseñada para mejorar la comprensión de la lengua española por parte de los sistemas de inteligencia artificial (IA).[5]​ Se trata del primer modelo masivo de IA en español de acceso abierto. Su desarrollo se ha basado en una base de datos proporcionada por la Biblioteca Nacional, que contiene 135.000 millones de palabras.[6]​ MarIA se entrena para aprender a contextualizar el vocabulario, utilizando para ello la potencia del superordenador MareNostrum.

Además, también lidera AINA,[7]​ una iniciativa de inteligencia artificial y tecnologías del lenguaje que tiene como objetivo potenciar el uso del catalán en el mundo digital.[8]​ El proyecto genera y pone a disposición de todos recursos lingüísticos, corpus y modelos informáticos para que los desarrolladores de aplicaciones basadas en IA puedan integrarlos fácilmente en catalán, captado a través de la plataforma Common Voice.[9]​ Esto incluye asistentes de voz, traductores automáticos, correctores y agentes conversacionales, con el fin de facilitar la interacción en catalán en el ámbito digital.[3]

En enero de 2025 el Gobierno de España presentó ALIA,[10]​ una iniciativa que agrupa los proyectos dirigidos por Villegas, incluyendo, MarIA y AINA.[11]

Además, Villegas ha publicado numerosos estudios y forma parte del equipo técnico del Plan de Impulso de las Tecnologías del Lenguaje de la Agenda Digital para España.

Reconocimientos

En 2022, Marta Villegas ganó el Premio Ciudad de Barcelona en la categoría de Ciencias Experimentales y Tecnología por la construcción y desarrollo de los modelos de procesamiento de lenguajes naturales para el catalán y el castellano, AINA y MarIA.[12]​ El proyecto MarIA liderado por Villegas ha recibido a su vez otros reconocimientos como el premio Archiletras,[13]​ convocado por la editorial Prensa y Servicios de la Lengua para reconocer los méritos en la promoción, apoyo, investigación y desarrollo de la lengua española y otras del territorio español.

Referencias

  1. Villegas, MARTA VILLEGAS Position: LEADER LANGUAGE TECHNOLOGIES UNIT Barcelona Supercomputing Center-Centro Nacional de Supercomputación Life Sciences- Language Technologies. «Marta Villegas». BSC-CNS (en inglés). Consultado el 8 de febrero de 2025. 
  2. Soler, Adrián (3 de mayo de 2024). «Marta Villegas: "Lo ideal es que podamos hablar con las máquinas en nuestras lenguas maternas"». Paréntesis.Media. Consultado el 8 de febrero de 2025. 
  3. a b Gordillo, Saül. «Marta Villegas, mestra de català de la IA - 01 oct 2024». El Punt Avui (en catalán). Consultado el 8 de febrero de 2025. 
  4. Villegas Montserrat, Marta (1998). "Controlled subjects in Spanish and other ""non-strictly local"" bounded dependency constructions". Universitat Politècnica de Catalunya (UPC). Consultado el 8 de febrero de 2025. 
  5. «MarIA: el proyecto para enseñar español a las máquinas diseñado en Barcelona». Crónica Global. 6 de febrero de 2022. Consultado el 8 de febrero de 2025. 
  6. Neira, Pablo de Llano (25 de junio de 2022). «Acelerando la ciencia a 314.000 billones de operaciones por segundo». El País. Consultado el 8 de febrero de 2025. 
  7. «El entorno multilingüe español supone una oportunidad para la industria de los datos». El Español. 10 de noviembre de 2022. Consultado el 8 de febrero de 2025. 
  8. «AINA, el fomento del catalán en la era digital | Actividades». CCCB. Consultado el 8 de febrero de 2025. 
  9. Press, Europa (15 de febrero de 2022). «El Govern destina 3 millones al proyecto Aina para crear un corpus en catalán para tecnología». www.europapress.es. Consultado el 8 de febrero de 2025. 
  10. Pastor, Javier (23 de enero de 2025). «"El objetivo no es competir con ChatGPT": hablamos con los creadores de ALIA, la IA 100% española, para entender su futuro». Xataka. Consultado el 8 de febrero de 2025. 
  11. «Publicados los primeros modelos de ALIA, la familia de modelos de IA en castellano y lenguas cooficiales | España Digital 2026». espanadigital.gob.es. Consultado el 8 de febrero de 2025. 
  12. «Premio Ciudad de Barcelona para la investigadora Marta Villegas por los proyectos de procesamiento de lenguaje natural AINA y MarIA». BSC-CNS. Consultado el 8 de febrero de 2025. 
  13. «El proyecto MarIA del BSC, premio Archiletras de la Lengua a la innovación». BSC-CNS. Consultado el 8 de febrero de 2025. 

 

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia