Aller au contenu principal
Accueil

Menu principal

  • Accueil
  • Cadre institutionnel et juridique
    • Les données de la recherche à Sorbonne Université
    • Plans nationaux pour la science ouverte
    • Cadre juridique
  • Votre projet par étapes
    • Plan de gestion des données
    • Collecter ses données
    • Organiser et décrire ses données
    • Traiter & Analyser ses données
    • Stocker ses données
    • Archiver ses données
    • Partager ses données
    • Réutiliser ses données
    • Rendre vos données FAIR ?
    • Exigences des financeurs
  • Besoin d'accompagnement?
    • Les services
    • Se former
    • Les outils
    • L'équipe

Fil d'Ariane

  1. Accueil
Nom / Titre (fiche)
Exploiter Mistral OCR – Extraction et structuration de documents

Cet atelier a pour objectif d’initier à l’usage de Mistral OCR pour convertir des PDF/scans/images en contenus exploitables (texte, mise en page, tableaux, équations) et structurés.
Après une introduction (qualité des sources, paramètres, limites et bonnes pratiques), les participants réaliseront des travaux pratiques : préparation d’un document, lancement de l’OCR, récupération des résultats (export texte/Markdown/JSON selon les sorties disponibles), contrôle qualité, puis pistes d’intégration dans une chaîne de traitement (indexation, recherche, RAG, préparation d’édition numérique).

Pré-requis : ordinateur portable, un PDF ou des images de document à tester (facultatif mais recommandé).

Début
ven 23/01/2026 - 14:00
Fin
ven 23/01/2026 - 17:00
Lieu
BNF DataLab
S'inscrire
Formation assurée par
ObTIC - Observatoire des textes, des idées et des corpus
En savoir plus
Les ateliers numériques de l'ObTIC
Retour en haut👆🏼 
Propulsé par Drupal
Flux RSS

Pied de page

  • Mentions légales
  • Contact