El Corpus de aprendices de español, la nueva herramienta para profesionales de la enseñanza de la lengua

Leticia López de Silva

Pie de foto: Presentación del Corpus de aprendices de español

El Instituto Cervantes ha presentado, junto con la Universidad de Santiago de Compostela, un Corpus de aprendices de español como lengua extranjera (CAES). Se trata de una herramienta informática de gran utilidad y libre acceso para todos los profesionales de la enseñanza del español como Lengua Extranjera (ELE). El objetivo es mejorar la promoción y aprendizaje del español en todo el mundo.

El acto ha sido presentado por el director del Instituto Cervantes, Víctor García de la Concha; el catedrático de Lingüística de la Universidad de Santiago de Compostela, Guillermo Rojo; el director académico del Cervantes, Julio Martínez Mesanza; y el jefe del departamento de Ordenación y proyectos académicos, Álvaro García Santa-Cecilia. La intención del proyecto es que profesores, investigadores, evaluadores, autores de matemáticas didácticos y responsables de entidades lingüísticas, entre otros profesionales, encuentren en CAES información práctica para llevar a cabo su enseñanza.

El CAES contiene muestras de textos producidos por 1.423  estudiantes de español en todo el mundo, quienes escribieron dos o tres textos cada uno, lo cual suma un total de 3.878 tareas integradas. Por lo tanto, permitirá a los usuarios realizar investigaciones basadas en datos objetivos, proporcionando información sobre las dificultades que surgen a lo largo del aprendizaje que podrán llevar a cabo en las aulas o integrar en los métodos de enseñanza.

El Instituto Cervantes llevó a cabo una recogida de muestra de lengua en 28 centros de todo el mundo entre estudiantes de español. Participaron universidades españolas, de Estados Unidos y de Portugal. Eligieron estudiantes de seis lenguas de origen diferentes –árabe, chino mandarín, francés, inglés, portugués y ruso- que además contasen con distintos grados de dominio lingüístico (nivel A1 a C1 del Marco común europeo de referencia). Los datos han sido recogidos con una herramienta informática creada para esta iniciativa.

Un corpus es un conjunto de textos en formato electrónico que han sido reunidos para facilitar el estudio de la lengua o variedad lingüística de la que esos textos han sido extraídos. Este corpus contiene textos producidos por personas que están aprendiendo otra lengua, en el caso actual, el español. Comprende casi 575.000 elementos lingüísticos, atendiendo a todos los niveles de español adquiridos y las seis lenguas iniciales mencionadas.

El nuevo CAES supone un avance tecnológico de la institución en beneficio de la lingüística y la promoción del español. En esta línea se asocian otras iniciativas como el nuevo AVE Global (cursos para aprender español a través de dispositivos móviles), el certificado de español SIELE o la creciente oferta de cursos formativos para profesores de español.

García de la Concha ha destacado el trabajo de Guillermo Rojo, quien ha diseñado y desarrollado esta investigación y cuya labor de informatización de la Real Academia Española permitió la creación de sucesivos corpus de esta institución: el CORDE (Corpus Diacrónico del Español), el CREA (Corpus de Referencia del Español Actual) y el CORPES (Corpus del Español).

La información ya puede consultarse a través de la aplicación que permite seleccionar los datos según los parámetros utilizados en la configuración del corpus: nivel adquirido de conocimiento de español, lengua familiar, país de residencia, edad y sexo. Las consultas pueden ser simples o combinadas con distintas variables.

Más en Cultura