Uno de los proyectos a corto plazo más ambiciosos de la Real Academia Española (RAE) es el Corpus del Español del Siglo XXI (Corpes), que reunirá unas 300 millones de formas del español desde 2005 hasta el presente.
Se trata de un compendio de textos en español que servirán como base para comparar los usos del idioma en los diferentes países, con múltiples resultados estadísticos por región también, explicó Guillermo Rojo, docente del departamento de lingua española de la Universidad de Santiago de Compostela (España) y coordinador de la obra que estará lista en diciembre de 2014, pero a la que se podrá tener acceso desde la primera semana de diciembre de 2013 por medio de la página web de la RAE.
“La aplicación de consulta permite siempre la opción de obtener directamente los ejemplos de los textos o bien trabajar primero con los datos estadísticos generales y luego ir seleccionando los números específicos que interesen”, acotó Rojo.
El material del Corpes proviene de América en un 70% y un 30% de España.
ANTECEDENTES
El Corpes es el seguimiento a una labor que lleva la RAE desde 1995, cuando empezaron el Corpus de referencia del Español Actual (Crea) y el Corpus Diacrónico del Español (Corde), que reúnen unas 260 millones de formas del español desde los orígenes del idioma hasta 2004.