Atelier Data Lab Transcription d'écritures manuscrites

Actions et tableau de desciption

Ventes achevées

Informations sur l'événement

Partager cet événement

Date et heure

Adresse

Adresse

Événement en ligne

Description de l'événement
Des retours d'expériences pour découvrir des outils de transcription d'écritures manuscrites collaborative et automatique.

À propos de cet événement

Mardi 26 janvier 2021- de 15h à 17h30

Evénement en ligne : une fois l'inscription réalisée , le lien zoom de l'atelier vous sera communiqué par mail 2 jours avant l'événement.

La transcription de l’écriture manuscrite constitue l’un des enjeux du travail de recherche et d’exploitation des collections numérisées : temps de traitement long, difficulté à industrialiser les procédés, question autour de la valorisation et du devenir des corpus transcrits. Face à ces questionnements, deux solutions semblent émerger :

• La transcription collaborative sur des plateformes ouvertes à des contributeurs bénévoles participant à la transcription (et parfois à l’encodage) des manuscrits ;

• La transcription automatique, qui utilise les techniques de reconnaissance d’image issues de l’IA (dit HTR : Handwritten Text Recognition), ou la transcription semi-automatique qui utilise le participatif pour corriger et annoter les documents en post traitement.

La BnF, en tant qu’institution patrimoniale et acteur de la recherche se pose également la question de solutions de transcription, qu’elle soit sous forme de plateforme participative, ou d’outils mis à la disposition des usagers pour traiter leurs corpus. A l’heure où les technologies semblent atteindre un certain niveau de maturité, d’autres questions viennent alors : comment fédérer une communauté autour d’une plateforme ; comment verser ces transcriptions dans les outils déjà existants ; comment accompagner les chercheurs sur ces nouveaux outils ?

A travers la présentation d’outils et de projet de recherche, cet atelier vise deux objectifs principaux : 

• partager les résultats de la recherche et fédérer une communauté d’usagers autour des outils qui seront mis à disposition dans le BnF DataLab ;

• acculturer les acteurs aux traitements automatisés sur des collections qui jusqu’à présent échappaient à l’analyse de masse (manuscrits, tapuscrits, imprimés anciens, écritures non latines, etc.).

Intervenant.e.s :

Jean-Philippe Moreux (BnF, expert scientifique Gallica),Pauline Charbonnier (Archives nationales, ingénieur d’études) Vanessa Desclaux ( BnF, conservatrice au service des manuscrits orientaux), Anais Wion (CNRS, chargée de recherche), Emmanuelle Bermès (BnF, adjointe chargée des questions scientifiques et techniques auprès du Directeur des services et des réseaux) Daniel Stökl Ben Ezra (EPHE), Alix Chagué (INRIA, ingénieure recherche et développement), Aurélia Rostaing (Archives nationales, conservatrice du patrimoine) Dominique Stutzmann, (CNRS-IRHT, chargé de recherche)

Date et heure

Adresse

Événement en ligne

Sauvegarder cet événement

Événement sauvegardé