Aller au contenu principal

OpenCorpusCollection

miil |

Le projet OpenCorpusCollection est cofinancé par le MiiL et le Cental.

Son objectif est de fournir aux projets de recherche et aux chercheurs des ressources ouvertes issues des réseaux sociaux (Twitter, Reddit, Instagram, TikTok...) dont les méthodes d'échantillonnage sont clairement décrites et scientifiquement ancrées. Le cadre théorique de ce projet est l'approche de la théorie ancrée de Lai et To (2015) et Tromble et al. (2017).

Les corpus sont constitués de textes et d'images dans différentes langues, par ex. en anglais, français, norvégien et néerlandais.

Ces ressources sont fournies avec des métadonnées comme les méthodes d'échantillonnage et d'autres informations (date, langue...).

OpenCorpusCollection développe également un outil de requête pour les utilisateurs non informaticiens (en français pour le moment).

  • Timeschedule : 2020 -  
  • Promoteurs : Louise-Amélie Cougnon et Patrick Watrin (pour le Cental)
  • Financement : MiiL et Cental