<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
  <channel>
    <title>News of Centre de traitement automatique du langage</title>
    <link>https://www.uclouvain.be/fr/news/cental</link>
    <description>Latest news of Centre de traitement automatique du langage</description>
    <atom:link xmlns:atom="http://www.w3.org/2005/Atom" href="https://www.uclouvain.be/fr/news/cental/feed" type="application/rss+xml" rel="self"/>
    <language>fr</language>
    <pubDate>Tue, 09 Jun 2026 13:47:31 +0200</pubDate>
    <lastBuildDate>Tue, 09 Jun 2026 13:47:31 +0200</lastBuildDate>
    <ttl>60</ttl>
    <item>
      <title>École d’été : IA pour le traitement de données textuelles en Python</title>
      <link>https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/ecole-dete-ia-pour-le-traitement-de-donnees-textuelles-en-python</link>
      <description>Formation intensive sur le text mining en Python</description>
      <content:encoded><![CDATA[<img src="https://www.uclouvain.be/system/files/uclouvain_assetmanager/groups/cms-editors-cental/events/ecole_ete_2026_banner.png" width="1032" height="584"><p class="text-align-justify">Fort du succès des éditions précédentes, l'école d'été « Intelligence artificielle pour le traitement de données textuelles en Python » revient pour une nouvelle édition, <strong>du 13 au 17 juillet 2026,</strong> à l'UCLouvain (Louvain-la-Neuve, Belgique).</p><p class="text-align-justify">Organisée par la plateforme SMCS et le CENTAL, cette formation intensive de 5 jours s'adresse aux personnes disposant d'une base en Python et souhaitant acquérir des compétences de pointe en text mining, deep learning et IA générative appliqués au langage naturel.</p><p><u>Au programme :</u></p><ul><li>Acquisition, nettoyage et prétraitement de corpus textuels</li><li>Représentation vectorielle des textes</li><li>Similarité de documents et clustering thématique</li><li>Classification et étiquetage automatique</li><li>Génération augmentée de récupération (RAG)</li></ul><p>&nbsp;</p><p class="text-align-justify">À l'heure où les grands modèles de langue (LLM) transforment en profondeur notre manière d'analyser, de générer et d'exploiter les données textuelles, cette formation vous donne les clés concrètes pour maîtriser ces technologies et les appliquer à vos propres données.</p><p class="text-align-justify">La formation mêle exposés théoriques et mises en situation pratiques : vous repartirez avec du code fonctionnel et une chaîne de traitement complète en Python.</p><p class="text-align-justify"><a href="https://sites.uclouvain.be/training/smcs/view.php?id=713&amp;l=fr">Infos &amp; inscriptions</a><br><a href="https://sites.uclouvain.be/training/smcs/docs/smcs/upload/flyers/Ecole_Ete_Text_Mining_UCLouvain_2026_07.pdf">Brochure de présentation du programme</a></p><p class="text-align-justify">&nbsp;</p>]]></content:encoded>
      <category>UCLouvain Page actualité</category>
      <guid isPermaLink="false">https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/ecole-dete-ia-pour-le-traitement-de-donnees-textuelles-en-python</guid>
      <pubDate>Wed, 01 Apr 2026 12:00:37 +0200</pubDate>
      <author>Centre de traitement automatique du langage</author>
    </item>
    <item>
      <title>École d'été : I.A. pour le traitement de données textuelles en Python</title>
      <link>https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/formation-ia-text-mining-python</link>
      <description>🚨Plus que quelques jours pour s'inscrire ! Du 7 au 11 juillet 2025 à l’UCLouvain.</description>
      <content:encoded><![CDATA[<img src="https://www.uclouvain.be/system/files/styles/crop_thumbnail/private/uclouvain_assetmanager/groups/cms-editors-cental/events/summer_school_2025_0.jpeg?itok=-_TELsYZ" data-align="right" width="318" height="452"><p class="text-align-justify">Une école d’été ouverte à toutes et tous, intitulée « Intelligence artificielle pour le traitement de données textuelles en Python », se tiendra <strong>du 7 au 11 juillet 2025</strong> à l’UCLouvain (<strong>Louvain-la-Neuve</strong>, Belgique).</p><p class="text-align-justify">Organisée par la plateforme <strong>SMCS</strong> et le <strong>CENTAL</strong>, cette formation intensive s’adresse aux personnes disposant d’une base solide en Python et souhaitant approfondir leurs compétences en text mining et en traitement automatique du langage naturel.</p><p class="text-align-justify"><strong>Au programme :</strong><br>- Acquisition et prétraitement de données<br>- Mesures de similarité de documents<br>- Classification et étiquetage automatique de textes<br>- Application de techniques d’apprentissage automatique et profond (transformers, embeddings, etc.)<br>- Génération augmentée de récupération (RAG)<br>- …</p><p class="text-align-justify">Les méthodes présentées reposeront sur certaines approches statistiques encore très utilisées aujourd'hui, mais aussi sur les avancées plus récentes dans le domaine des réseaux de neurones, du deep learning et des grands modèles de langage. La formation se veut à la fois théorique et pratique.</p><p class="text-align-justify"><a href="https://sites.uclouvain.be/training/smcs/view.php?id=622&amp;l" target="_blank">Infos &amp; inscriptions</a>&nbsp;<br><a href="https://sites.uclouvain.be/training/smcs/docs/smcs/upload/flyers/ecole_ete_2025_07_03.pdf" target="_blank">Brochure de présentation du programme</a></p>]]></content:encoded>
      <category>UCLouvain Page actualité</category>
      <guid isPermaLink="false">https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/formation-ia-text-mining-python</guid>
      <pubDate>Thu, 05 Jun 2025 13:58:44 +0200</pubDate>
      <enclosure url="https://www.uclouvain.be/system/files/uclouvain_assetmanager/groups/cms-editors-adpi/gplo/AAoptoma%20.jpg" type="image/jpeg" length="8296"/>
      <author>Centre de traitement automatique du langage</author>
    </item>
    <item>
      <title>Bourse de doctorat :  Normalisation et correction automatisée de productions écrites d’apprenants</title>
      <link>https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/phd-fle-ai</link>
      <description>Le CENTAL recrute un·e doctorant·e pour un projet de recherche ambitieux et novateur !</description>
      <content:encoded><![CDATA[<ul><li><span><strong>Bourse de doctorat à temps plein (100%) pour une durée de deux ans, renouvelable une fois sous conditions</strong></span></li><li><span>Pour le Centre de traitement automatique du langage (CENTAL), de l'Institut langage et communication (ILC) à l’UCLouvain (Louvain-la-Neuve)</span></li><li><span>Entrée en fonction: 1er septembre 2025 (négociable)</span></li></ul><hr><p class="text-align-justify"><span>Cette proposition de bourse de doctorat s’articule sur les travaux récents réalisés par le Centre de traitement automatique du langage (CENTAL) sur des données de productions écrites d’apprenants du français langue étrangère. Reposant sur une collaboration féconde avec FEI (France Éducation International), ces recherches ont déjà abouti dans une solution de correction automatisée des épreuves écrites du TCF, </span><a href="https://www.france-education-international.fr/actualites/lettre-fei/2024-06/une-nouvelle-ere-pour-levaluation-fidelia-et-lintelligence-artificielle-au-service-du?langue=fr" target="_blank"><span>FIDELIA</span></a><span>.</span></p><p class="text-align-justify"><span>Dans ce projet, nous visons à dépasser la simple caractérisation de la compétence écrite des apprenants de FLE, en détectant automatiquement&nbsp; les erreurs qu’ils commettent afin de les corriger (= normalisation). Ce projet vise à combler l’absence de travaux en matière de normalisation et de correction neuronale des erreurs d’apprenants en français et s’inscrit dans la logique du centre K de l’UCLouvain (CLARIN). La détection des erreurs d’apprenants et leur normalisation ouvrent de nombreuses perspectives : correction automatisée, génération de feedback, amélioration des recherches sur corpus grâce à la forme normée, etc.&nbsp;</span></p><p class="text-align-justify"><span>Pour ce faire, ce projet visera trois objectifs principaux :&nbsp;</span></p><ol><li><p class="text-align-justify"><span>Constituer un corpus parallèle (version originale et normalisée) pour 6569 textes d’apprenants rédigés dans le cadre d’un examen officiel de français, le TCF. Ce corpus, rassemblé en collaboration avec France Éducation Internationale, constitue une ressource unique pour le français (Wilkens et al., 2022). Il s’agira de le normaliser manuellement (i.e. identifier et corriger les erreurs), mais aussi de les classer selon une typologie inspirée de Granger (2003).</span></p></li><li><p class="text-align-justify"><span>Profiter des dernières avancées en matière d’apprentissage profond pour exploiter ce corpus annoté et concevoir un système automatisé capable de (1) normaliser les productions d’apprenants en français et (2) de les catégoriser en fonction de notre typologie. Nous comparerons cette solution aux performances des modèles génératifs de type ChatGPT, qui ne nécessitent pas de données d’entraînement (zero-shot learning).</span></p></li><li><p class="text-align-justify"><span>Exploiter les méta-données du corpus (niveau CECR et langue maternelle) pour décrire (1) les types d’erreurs typiques de chaque niveau CECR ; (2) les erreurs typiques de locuteurs ayant une langue maternelle donnée et (3) l’interaction entre ces deux variables, à savoir comment les erreurs se distribuent par niveau en fonction de la langue maternelle.&nbsp;</span></p></li></ol><p class="text-align-justify"><span>Au sein de projet, le rôle du doctorant ou de la doctorante engagé consistera à mener l’essentiel de la recherche, à savoir réaliser les trois étapes décrites ci-dessus. Le chercheur ou la chercheuse devra également assurer la diffusion des résultats obtenus via des publications scientifiques et rédiger une thèse de doctorat. Il ou elle sera amené à collaborer étroitement avec les autres membres de l’équipe en vue d’assurer la bonne réalisation de ces tâches</span>.</p><h3 class="text-align-justify"><span><strong>Environnement de travail</strong></span></h3><p class="text-align-justify">Le CENTAL&nbsp;est rattaché à l’Institut Langage &amp; Communication, qui fait partie de l’UCLouvain. Cette université est située à Louvain-la-Neuve, une ville piétonne, agréable à vivre et très dynamique. Le projet de recherche sera réalisé sous la direction du Pr. <a href="https://cental.uclouvain.be/team/tfrancois/" target="_blank">Thomas François</a>, expert en lisibilité et en simplification automatique de la langue et du Dr. <a href="https://www.linkedin.com/in/pwatrin/" target="_blank">Patrick Watrin</a>, expert dans les larges modèles de langue appliqués à la recherche d’information et le traitement numérique des corpus.</p><h3 class="text-align-justify"><span><strong>Qualifications et aptitudes requises</strong></span></h3><p class="text-align-justify"><span>Le candidat répondra aux qualifications suivantes&nbsp;:&nbsp;</span></p><ul><li><span>Être porteur d’un master en Linguistique computationelle, en Traitement automatique du langage (TAL) ou en Informatique (option en Intelligence artificielle).</span></li><li><span>Faire montre d’un excellent parcours académique</span></li><li><span>Disposer de bonnes compétences informatiques :</span><ul><li><span>langages de programmation&nbsp;: Python, R (ou similaire)</span></li><li><span>la connaissance de scikit-learn, pandas, tensorflow/keras et/ou pytorch</span></li><li><span>systèmes&nbsp;: Linux de préférence</span></li></ul></li><li><span>Bonne connaissance des principaux outils et algorithmes du TAL. La connaissance des réseaux de neurones profonds est un plus.</span></li><li><span>Excellente maîtrise du français (niveau C1 minimum) et bonne connaissance de l’anglais (niveau B2 minimum)</span></li><li><span>Autonomie, curiosité, sens du travail en équipe, capacité d’écoute et d’analyse des besoins, réactivité.</span></li></ul><h3 class="text-align-justify"><span><strong>Conditions d’engagement</strong></span></h3><p class="text-align-justify"><span>Cette <strong>bourse de doctorat</strong> est soumise aux conditions suivantes :</span></p><ul><li><p class="text-align-justify"><span>Le candidat ou la candidate, suite à la procédure de recrutement, devra encore être approuvée par le Conseil de Recherche de l’UCLouvain.&nbsp;&nbsp;</span></p></li><li><p class="text-align-justify"><span>À la date d’engagement, le doctorant doit être titulaire depuis au maximum 3 ans* d’un grade académique de master 120 crédits ou d’un grade reconnu comme équivalent.</span></p></li><li><p class="text-align-justify"><span>Le candidat ou la candidate devra se domicilier en Belgique pendant la durée du contrat de bourse.</span></p></li><li><p class="text-align-justify"><span>Le <strong>montant net&nbsp;</strong>de la bourse est d’environ<strong> 2 500 euros par mois</strong>.&nbsp;</span></p></li><li><p class="text-align-justify"><span>Pour voir sa bourse être renouvelée pour une période de deux ans supplémentaires, le candidat ou la candidate devra soumettre une demande de financement auprès du FNRS et être classé à minima au rang «&nbsp;A&nbsp;» ainsi qu’avoir réussi son épreuve de confirmation.&nbsp;&nbsp;</span></p></li></ul><p class="text-align-justify"><span>* Le délai maximum fixé ci-dessus est augmenté d’une année par accouchement et/ou par adoption.&nbsp;</span></p><h3 class="text-align-justify"><span>Dossier de candidature&nbsp;</span></h3><p class="text-align-justify"><span><strong>Date limite de remise du dossier : 1er juillet</strong></span></p><p class="text-align-justify">Si vous êtes intéressé par ce poste, merci d'envoyer votre dossier de candidature à Thomas François (<a href="mailto:thomas.francois@uclouvain.be">thomas.francois@uclouvain.be</a>) et Patrick Watrin (<a href="mailto:patrick.watrin@uclouvain.be">patrick.watrin@uclouvain.be</a>) par mail. Celui-ci devra inclure :</p><p class="text-align-justify"><span>1. un <strong>curriculum vitae</strong> détaillé en français ou anglais reprenant les différentes qualifications et aptitudes requises, les détails de votre parcours académique (grades, listes de cours), ainsi que les éventuelles publications et autres expériences académiques et scientifiques ;</span></p><p class="text-align-justify"><span>2. une <strong>lettre de motivation</strong> en français, décrivant votre intérêt pour le poste, comment votre profil répond à la description du poste et aux objectifs du projet, etc. (maximum 2 pages)&nbsp;;</span></p><p class="text-align-justify"><span>3. une <strong>lettre de référence</strong> en français ou en anglais de la part d’un ou d’une de vos professeur(e)s.</span></p><p class="text-align-justify"><span>4. Un «&nbsp;<strong>academic statement&nbsp;»</strong>&nbsp;: une déclaration académique concise dans laquelle vous exposez vos attentes vis-à-vis de vos études de troisième cycle (doctorat), ainsi que vos objectifs de carrière. </span></p><p class="text-align-justify"><span>Les candidats retenus seront invités à participer à un entretien via vidéo-conférence selon des modalités qui leur seront ensuite transmises par mail.&nbsp;</span></p><h3 class="text-align-justify"><span><strong>Plus d'informations</strong></span></h3><p class="text-align-justify">Les questions concernant le poste ou la procédure de candidature doivent être envoyées par e-mail à Thomas François (<a href="mailto:thomas.francois@uclouvain.be">thomas.francois@uclouvain.be</a>) et à&nbsp;Patrick Watrin (<a href="mailto:patrick.watrin@uclouvain.be">patrick.watrin@uclouvain.be</a>) avant le 20 juin.</p>]]></content:encoded>
      <category>UCLouvain Page actualité</category>
      <guid isPermaLink="false">https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/phd-fle-ai</guid>
      <pubDate>Tue, 03 Jun 2025 11:47:52 +0200</pubDate>
      <enclosure url="https://www.uclouvain.be/system/files/uclouvain_assetmanager/groups/cms-editors-adfi/acha/liste-de-produits-accessibles/20260216_Bio-Rad%20%20prix%202026%20Liste%202.pdf" type="application/pdf" length="595603"/>
      <author>Centre de traitement automatique du langage</author>
    </item>
    <item>
      <title>École d'été : Intelligence artificielle pour le traitement de données textuelles en Python</title>
      <link>https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/ecole-dete-intelligence-artificielle-pour-le-traitement-de-donnees-textuelles-en-python</link>
      <description>Formation intensive s’adressant aux personnes souhaitant approfondir leurs compétences en text mining et en traitement automatique du langage naturel.</description>
      <content:encoded><![CDATA[<img src="https://www.uclouvain.be/system/files/styles/crop_thumbnail/private/uclouvain_assetmanager/groups/cms-editors-cental/events/summer_school_2025_0.jpeg?itok=-_TELsYZ" data-align="right" width="318" height="452"><p class="text-align-justify">Une école d’été ouverte à toutes et tous, intitulée « Intelligence artificielle pour le traitement de données textuelles en Python », se tiendra <strong>du 7 au 11 juillet 2025</strong> à l’UCLouvain (<strong>Louvain-la-Neuve</strong>, Belgique).</p><p class="text-align-justify">Organisée par la plateforme <strong>SMCS</strong> et le <strong>CENTAL</strong>, cette formation intensive s’adresse aux personnes disposant d’une base solide en Python et souhaitant approfondir leurs compétences en text mining et en traitement automatique du langage naturel.</p><p class="text-align-justify"><strong>Au programme :</strong><br>- Acquisition et prétraitement de données<br>- Mesures de similarité de documents<br>- Classification et étiquetage automatique de textes<br>- Application de techniques d’apprentissage automatique et profond (transformers, embeddings, etc.)<br>- Génération augmentée de récupération (RAG)<br>- …</p><p class="text-align-justify">Les méthodes présentées reposeront sur certaines approches statistiques encore très utilisées aujourd'hui, mais aussi sur les avancées plus récentes dans le domaine des réseaux de neurones, du deep learning et des grands modèles de langage. La formation se veut à la fois théorique et pratique.</p><p class="text-align-justify"><a href="https://sites.uclouvain.be/training/smcs/view.php?id=622&amp;l" target="_blank">Infos &amp; inscriptions</a>&nbsp;<br><a href="https://sites.uclouvain.be/training/smcs/docs/smcs/upload/flyers/ecole_ete_2025_07_03.pdf" target="_blank">Brochure de présentation du programme</a></p>]]></content:encoded>
      <category>UCLouvain Page actualité</category>
      <guid isPermaLink="false">https://www.uclouvain.be/fr/instituts-recherche/ilc/cental/news/ecole-dete-intelligence-artificielle-pour-le-traitement-de-donnees-textuelles-en-python</guid>
      <pubDate>Mon, 24 Mar 2025 10:42:39 +0100</pubDate>
      <enclosure url="https://www.uclouvain.be/system/files/uclouvain_assetmanager/groups/cms-editors-adpi/gplo/AAoptoma%20.jpg" type="image/jpeg" length="8296"/>
      <author>Centre de traitement automatique du langage</author>
    </item>
  </channel>
</rss>
