CLARIN Knowledge Centre for Learner Corpora

ILC Louvain-La-Neuve, Mons

Le CLARIN Knowledge Centre for Learner Corpora (CKL2CORPORA) est un nouveau centre de connaissances CLARIN avec reconnaissance officielle depuis le 28 novembre 2022 pour une durée de 3 ans.

Missions

Le CLARIN Knowledge Center for Learner Corpora offre des connaissances spécialisées sur la collecte et l'utilisation de corpus d'apprenants (c'est-à-dire des collections électroniques de données linguistiques produites par des apprenants de langues secondes ou étrangères) à des fins théoriques et appliquées. Le partage de l'expertise peut prendre différentes formes : répondre à des questions (théoriques, méthodologiques, techniques) envoyées par l'intermédiaire du centre de connaissances. helpdesk pour partager des resources et fournir des services de formations.

Le centre K s'appuie sur plus de 30 ans d'expertise en matière de recherche sur les corpus d'apprenants (de la conception à l'analyse des corpus) au sein de l'Institut de Recherche de l'Union européenne (IRU): Centre for English Corpus Linguistics (CECL).

Entre autres choses, membres du CECL ont notamment lancé la Learner Corpus Bibliography et maintiennent également la page web Learner Corpora around the World . Ce sont les membres fondateurs du Learner Corpus Association . Ils ont également lancé le International Journal of Learner Corpus Research. Ils ont publié de nombreux ouvrages sur la recherche de corpus d'apprenants. Les publications principales CECL incluent The Cambridge Handbook of Learner Corpus Research (edited by S. Granger, G. Gilquin, & F. Meunier, 2015) and The Routledge Handbook of Second Language Acquisition and Corpora (N. Tracy-Ventura & M. Paquot, 2021).

Actuellement, le centre K s'appuie sur l'expertise du personnel de trois centres de recherche de l'Institut de recherche de l'Union européenne de la  Linguistic Research Unit de l' Institut du Language et Communication (ILC): 

 

Ensemble, les trois centres de recherche possèdent une expertise dans la conception de corpus d'apprenants (métadonnées, transcription, éthique), l'annotation (étiquetage POS, analyse syntaxique, annotation d'erreurs) et l'analyse.

Les projets actuels des membres de CKL2CORPORA comprennent le développement d'un schéma de métadonnées de base pour les corpus d'apprenants (métadonnées, transcription, éthique) "Core Metadata Schema for Learner Corpora" (Paquot et al., 2023) et le développement de FABRA (Wilkens et al., 2022), un outil développé à l'origine pour la recherche sur la lisibilité, mais qui peut également être utilisé pour calculer un large éventail de mesures de complexité linguistique pour le français.

Plus généralement, les membres du CKL2CORPORA et les collègues du CEI sont spécialisés dans la linguistique appliquée, la linguistique de corpus, le traitement du langage naturel, l'acquisition d'une seconde langue et les études de traduction. Ils possèdent des connaissances dans une variété de sujets linguistiques (complexité linguistique, phraséologie, marqueurs de discours, morphologie, variation linguistique, influence interlinguistique), de théories (approches de l'acquisition des langues basées sur l'usage, grammaire de construction) et de méthodologies (analyse interlangue contrastive, analyse du discours, analyse des erreurs, etc.), qu'ils utilisent souvent pour explorer comment les langues varient les unes par rapport aux autres, et comment chaque langue varie en fonction de son contexte d'utilisation. Cette boîte à outils théorique et méthodologique peut être appliquée à un large éventail de variétés de langues et de registres (langue de l'apprenant, traduction, écriture académique, communication assistée par ordinateur).

Infrastructure CLARIN

Le Knowledge Centre for Learner Corpora fait partie du CLARIN-BE, l'infrastructure belge pour les ressources et technologies linguistiques .

CLARIN-BE gère la partie belge de l'initiative paneuropéenne CLARIN .

CLARIN Knowledge Centre est la pierre angulaire de l'infrastructure de CLARIN Knowledge et possède ses propres domaines d'expertise (langues individuelles, sujets de traitement des langues, types de données, etc.)