Conventions de transcription

Le centre de recherche VALIBEL a adopté des conventions de transcription qui n’ont pratiquement pas varié depuis sa fondation (9000 pages ont déjà été transcrites). Les corpus qui constituent la banque de données textuelles orales du centre obéissent donc aux mêmes conventions générales, détaillées ci-après, et auxquelles peuvent s’ajouter des conventions additionnelles propres à certaines exploitations (phénomènes de liaison, intonation, etc.).

Les corpus de la banque de données VALIBEL ne sont pas actuellement accessibles "en ligne". Quelques échantillons sont reproduits ici, pour illustrer la mise en œuvre des conventions dans des extraits un peu plus étendus.

La maîtrise des techniques de transcription et d’encodage sur support informatique requiert un apprentissage spécifique. Le Centre VALIBEL met son expertise dans ce domaine au service des chercheurs désireux de travailler sur des corpus oraux de français, à l’occasion de formations et de consultances.

Les conventions de transcription Valibel (version 2004, révisées le 18 avril 2007) sont téléchargeables (fichier .pdf).

D'autres équipes ont adopté des conventions de transcriptions convergentes avec les nôtres:

  • le Centre de Recherche en Linguistique Appliquée de l'Université de Moncton:
          http://www.umoncton.ca/facarts/crla/crla.html
  • le corpus Valirun, à l'Université de la Réunion (Gudrun Ledegen)
  •  ... et bientôt le corpus Valisuisse, à l'Université de Genève (Anne Grobet)
| 12/05/2010 |