El "Corpus del Español del siglo XXI", el nuevo banco de datos de la Lengua española en el mundo, contará con 300 millones de formas léxicas, en un 70% de textos procedentes de América, según el convenio suscrito ayer entre la Real Academia Española (RAE) y el Banco de Santander.
Este fue uno de los proyectos presentados durante el IV Congreso Internacional de la Lengua, en Medellín (Colombia), por el director de la RAE, Víctor García de la Concha, que ayer firmó con el presidente del Banco de Santander, Emilio Botín, el acuerdo para materializarlo.
Se trata de ampliar el actual banco de datos que la Real Academia inició en 1996 con el Corpus de Referencia del Español Actual, que recogió 150 millones de registros desde 1975, y el Corpus Diacrónico del Español, de 300 millones de formas recogidas desde los orígenes del idioma hasta 1974, en un fondo que permitiera disponer de datos lingüísticos fiables.
El cambio radical que supuso para el sistema de trabajo de la RAE y la Asociación de 21 Academias de la Lengua permitió la XXII edición del Diccionario .

