Ventes achevées

Penser, classer, modéliser. L'exemple du projet Foucault Fiches de Lecture.

Informations sur l'événement

Partager cet événement

Date et heure

Adresse

Adresse

Bibliothèque nationale de France

Quai François Mauriac

Salle : Aquarium

75013 Paris

France

Afficher la carte

Description de l'événement

Description

Inscrit au plan quadriennal de la recherche 2016-2019 de la BnF, le programme de recherche Corpus a pour objectif de construire un nouveau service de fourniture de corpus numériques à destination de la recherche. Un des axes explorés dans le cadre de ce projet consiste à accompagner les chercheurs dans leur appropriation des collections numériques. À cet effet, des ateliers d’échange sont régulièrement organisés entre des équipes de recherche partageant des enjeux méthodologiques, scientifiques et techniques similaires, ainsi que les personnels BnF experts des sujets abordés.
Cette année, nous suivons en particulier le travail de l’équipe de recherche travaillant sur le projet ANR Foucault Fiches de Lecture (FFL), dont le Service des manuscrits modernes et contemporains de la BnF est partenaire, afin d’étudier ses besoins en matière d'utilisation des données bibliographiques et plus globalement, sa pratique des humanités numériques. L'atelier "Penser, classer, modéliser", organisé en collaboration avec l'équipe travaillant sur le projet FFL et le département des Métadonnées de la BnF, se présente comme l'occasion de réfléchir ensemble, à partir d'un exemple concret, à des aspects de la modélisation et de l'enrichissement de données.

Le projet FFL a pour but de numériser, mettre en ligne, décrire et enrichir les manuscrits de notes de lecture de Michel Foucault, en utilisant une plate-forme numérique de travail collaboratif. Un prototype développé par l’équipe permet déjà de consulter les feuillets numérisés (environ 5700 feuillets actuellement), de les décrire et de les annoter : chaque utilisateur peut à la fois produire des métadonnées mutualisées et enregistrer des annotations privées. Basé sur les technologies RDF, le prototype permet également d'enrichir ces informations par un système de mashup et d'alignement avec les données bibliographiques et biographiques de data.bnf.fr [1]. Le projet vise ainsi à constituer une base de connaissances sur les sources de Foucault, ainsi qu’un référentiel terminologique du vocabulaire utilisé par le philosophe.

Parallèlement, des transcriptions seront réalisées, au moins pour une partie du corpus, en s'appuyant sur les fonctionnalités de la plate-forme eman. Afin de faciliter ce travail, l’utilisation du logiciel Transkribus (reconnaissance automatique d’écriture manuscrite) est envisagée : les résultats des tests réalisés [2] laissent espérer que l’équipe disposera bientôt d’une grande quantité de textes produits automatiquement, qui serviront de base pour la transcription manuelle, tout en permettant une indexation plein texte du corpus.

Il s’agit donc de réfléchir à l’articulation des données textuelles (provenant du relevé manuel des titres de fiches aussi bien que des transcriptions intégrales automatiques) avec les métadonnées renvoyant à des entités nommées (concepts, personnes, documents). Comment exploiter au mieux, structurer et harmoniser les différents types de données ? Un premier axe de travail consisterait à s’appuyer sur les index de notions réalisés pour les Cours au Collège de France, mais aussi sur des thesauri comme Rameau. Un deuxième axe serait d’utiliser les entités nommées déjà créées pour faciliter la correction des transcriptions automatiques et, réciproquement, d’utiliser les transcriptions pour le repérage et la création de nouvelles entités.

[1] Voir la présentation de ces fonctionnalités donnée lors de l'atelier Corpus précédent, le 10/07/2018 :
https://f-origin.hypotheses.org/wp-content/blogs.dir/3226/files/2018/07/Slides_atelier_bnf_Corpus_2.pdf

[2] https://halshs.archives-ouvertes.fr/hal-01794139v1


MODALITÉS PRATIQUES

Le 13 novembre à partir de 14 heures à la Bibliothèque nationale de France, sur le site François Mitterrand, dans la salle Aquarium.

Entrée libre sur inscription via cette page Eventbrite.

Info : eleonora.moiraghi@bnf.fr


Date et heure

Adresse

Bibliothèque nationale de France

Quai François Mauriac

Salle : Aquarium

75013 Paris

France

Afficher la carte

Sauvegarder cet événement

Événement sauvegardé