Cet atelier a pour objectif d’initier au traitement automatique du langage naturel (NLP) à l’aide de la bibliothèque Python spaCy, afin d’analyser et structurer des textes de manière efficace et reproductible. Après une introduction aux notions fondamentales du NLP et à l’architecture de spaCy, les participant·e·s réaliseront des travaux pratiques en environnement Jupyter Notebook / Google Colab : préparation d’un texte, tokenisation et segmentation, lemmatisation, reconnaissance d’entités nommées, etc. L’atelier se conclura par une discussion sur les bonnes pratiques et les possibilités d’intégration de spaCy dans des chaînes de traitement linguistique plus larges.
Prérequis : ordinateur portable