En el marco del Mobile World Congress (MWC) en Barcelona, el presidente del Gobierno de España, Pedro Sánchez, anunció un ambicioso proyecto para desarrollar un gran modelo fundacional de lenguaje de inteligencia artificial (IA) que estará entrenado en español y en el resto de lenguas cooficiales del país. Esta iniciativa, que se desarrollará en código abierto y en colaboración público-privada con instituciones clave como el Barcelona Supercomputing Center y la Real Academia Española, busca colocar a España en la vanguardia de la tecnología de IA, equilibrando la balanza lingüística actualmente dominada por el inglés.
El proyecto no solo tiene como objetivo crear un nuevo “ChatGPT” en español, sino establecer una capa intermedia de grandes modelos de IA que sirvan de base para el desarrollo de múltiples herramientas y aplicaciones por empresas, promoviendo así la soberanía tecnológica de España. Esta base permitirá adaptaciones específicas y el desarrollo de aplicaciones sin sesgos y adaptadas a diversos dominios, como el jurídico o el médico, marcando un hito en la independencia tecnológica y lingüística del país frente a los gigantes tecnológicos estadounidenses.
Para el entrenamiento de esta herramienta se utilizarán bases de datos públicas y con licencias adecuadas, desde Wikipedia hasta la Biblioteca Nacional, asegurando la fiabilidad de la información y evitando problemas de propiedad intelectual. Este enfoque garantiza un modelo de IA robusto, representativo y ajustado a la riqueza lingüística y cultural de España y sus lenguas cooficiales.
Aunque el proyecto todavía está en fases iniciales, con muchos detalles por definir, incluido su presupuesto, su importancia radica en la capacidad de España para avanzar hacia una mayor autonomía tecnológica y lingüística. El superordenador MareNostrum 5, pieza central de esta iniciativa, proporcionará la potencia de cálculo necesaria para abordar este reto, siendo uno de los ordenadores más potentes y sostenibles del mundo.
Los expertos consultados ven la iniciativa de forma positiva, aunque señalan desafíos como la diversidad dialectal del español, la definición de cómo se ofrecerá el modelo a las empresas y la necesidad de paciencia y coordinación entre las instituciones implicadas. A pesar de las incógnitas, este proyecto representa un paso significativo hacia la inclusión y la diversificación lingüística en el campo de la inteligencia artificial, con potencial para beneficiar a la sociedad española y a la comunidad hispanohablante en general.