Traiter et analyser ses données

OpenRefine I : Nettoyer ses données avec OpenRefine

Objectifs

Découvrir le logiciel OpenRefine pour traiter des données tabulées
Connaître les fonctionnalités utiles pour nettoyer, transformer, restructurer
ses données

Contenus

Présentation de l’interface d’OpenRefine
Créer des facettes, trier et filtrer ses données
Nettoyer ses données avec des fonction pré-enregistrées
Nettoyer ses données avec des formules en GREL
Exporter son projet ou ses données

Une session plus approfondie est également proposée en rendez-vous individuel pour compléter cette formation

Début

jeu 20/11/2025 - 10:00

Fin

jeu 20/11/2025 - 12:00

Lieu

En visioconférence

S'inscrire

Formation assurée par

Cellule données de la Bibliothèque de Sorbonne Université

FORMATIONS ET ATELIERS Résultats de la recherche : gérer, protéger et ouvrir

Pandore toolbox

Pandore offre un ensemble de modules permettant d'effectuer automatiquement les tâches les plus courantes liées au traitement de corpus pour la recherche en humanités numériques. Des chaînes de traitement permettant d'automatiser un ensemble de tâches sont également proposées.

Qui contacter pour être accompagné ?

ObTIC - Observatoire des textes, des idées et des corpus

En savoir plus sur l'outil

Pandore Toolbox

ObTIC

Traiter et analyser ses données

Collecter & organiser ses données

Découvrir la transcription de textes manuscripts : Escriptorium et Transkribus

Objectifs

Connaître l’offre logicielle pour transcrire des documents
Découvrir les principes et les étapes de la transcription
Découvrir les solutions Escriptorium et Transkribus

Contenus

Principes et méthodes de la transcription
Panorama des outils
Exemples de projets de transcription collaborative
Démonstration de Transkribus et eScriptorium

Rendez-vous individuel

S'inscrire

Formation assurée par

Cellule données de la Bibliothèque de Sorbonne Université

FORMATIONS ET ATELIERS Résultats de la recherche : gérer, protéger et ouvrir

Gérer et exploiter ses enregistrements sonores

Objectifs

Connaître les outils de gestion des enregistrements
Découvrir des entrepôts spécialisés pour les données d’entretiens

Contenus

Consentement, confidentialité… , comment collecter ?
Nommer, indexer et décrire les enregistrements
Stocker et archiver les données d’entretien
Exemples d’outils et entrepôts spécialisés, dont la plateforme COCOON

Début

ven 13/02/2026 - 10:00

Fin

ven 13/02/2026 - 12:00

Love Data Week 09-13 fev. 2026

Lieu

En visioconférence

S'inscrire

Formation assurée par

SARA - Service des archives et du recueil des actes

FORMATIONS ET ATELIERS Résultats de la recherche : gérer, protéger et ouvrir

OpenRefine II : Convertir, enrichir et exposer ses données

Objectifs

Récupérer des données sur le web
Utiliser les fonctions d’export avancé des données
Découverte de Wikidata

Contenus

Interroger des API, effectuer du web scraping pour enrichir ses données
Réconcilier des données avec Wikidata, ORCID…
Convertir des données structurées
Exposer ses données dans Wikidata

Prérequis

Maitriser les bases d’OpenRefine (voir formation Nettoyer ses données avec OpenRefine)

Rendez-vous individuel

S'inscrire

Formation assurée par

Cellule données de la Bibliothèque de Sorbonne Université

FORMATIONS ET ATELIERS Résultats de la recherche : gérer, protéger et ouvrir

La plateforme MeSU

Supercalculateur

Le supercalculateur MeSU est constitué d’équipements conçus pour la performance pour des tâches de simulation numérique ou de calcul intensif. Ce service est accessible sur demande.
La documentation pour les utilisateurs du supercalculateur est disponible dans un espace dédié.

Environnement de virtualisation

L’environnement de virtualisation MeSU permet l’hébergement sur la plateforme de machines virtuelles Linux. Celles-ci peuvent notamment servir à la mise en oeuvre de portails ou d’applications scientifiques reliés aux autres composants de calcul et de stockage de la plateforme. Ce service est accessible sur demande.

Stockage de données

En plus des stockages liés au supercalculateur et à l’environnement de virtualisation, la plateforme MeSU offre un stockage de plus de 400 To pour tout type de données scientifiques. Ce stockage est accessible sur demande.

Qui contacter pour être accompagné ?

SACADO - Service d'Aide au Calcul et à l'Analyse de Données

En savoir plus sur l'outil

Page internet de MESU

SACADO

Traiter et analyser ses données

Collecter & organiser ses données

Stocker ses données

Traiter & Analyser ses données

Traiter et analyser ses données