Panneau des Actions
D’Autrice à Zlataner : enrichissement linguistique et exploration des sites de presse dans les archives de l'internet à la BnF (2010-2017)
Où et quand
Date et heure
lun. 15 oct. 2018 13:30 - 19:00 CEST
Lieu
Bibliothèque nationale de France Quai François Mauriac Salle 70 75013 Paris France
Description
Cette demi journée d'étude, intitulée "d’Autrice à Zlataner : enrichissement linguistique et exploration des sites de presse dans les archives de l'internet à la BnF (2010-2017)", est l'occasion pour les acteurs du projet Néonaute de présenter les principaux résultats obtenus, les verrous qui demeurent à surmonter et d'envisager une suite à leurs travaux.
Néonaute est un projet financé de septembre 2017 à septembre 2018 par la DGLFLF dans le cadre de l'appel à projet 2017 « Langues et Numérique » qui rassemble deux laboratoires de recherche (LIPN-RCLN UMR 7030 CNRS Université Paris 13 SPC ; LILPA EA 1339, Université de Strasbourg) et la Bibliothèque nationale de France (BnF). Il vise à doter les observateurs de la langue française d’un moteur de recherche s'appuyant sur la collection « Actualités » du dépôt légal du web, conservée à la BnF depuis 2010 et comprenant plus de 10 To de données textuelles de la presse en ligne.
L'objectif principal du projet est d'enrichir les index disponibles avec les résultats d'une analyse linguistique automatique : analyse morphosyntaxique, détection des entités nommées (noms de personnes, de lieux et d'organisations), analyse thématique. Les différentes informations sont ensuite indexées et peuvent être interrogées. Trois cas d'utilisation sont également prévus, liés à la néologie et à son suivi en corpus. Néonaute se présente sous la forme d’une plateforme dotée de fonctionnalités de recherche avancée (exploitation de métadonnées, analyse linguistique automatique, visualisation interactive des résultats, recherche par liste de mots), dont un prototype est disponible en ligne.
L'événement est co-organiséeavec la DGLFLF, l'Université Paris 13 et l'Université de Strasbourg.
Programme
13h45-14h Café de bienvenue
14h-14h15 - Introduction par Loïc Depecker (délégué général à la langue française et aux langues de France) et Sylviane Tarsot-Gillery (directrice générale de la BnF)
14h15-14h30 - Présentation des collections du dépôt légal de l’internet par Peter Stirling (BnF)
14h30-16h15 - Enrichissement linguistique des sites de presse archivés à la BnF (Données, métadonnées, outils) / Animateur : Christophe Gérard
14h30-15h – De la collecte des sites à l'indexation des archives web / Sara Aubry (BnF)
15h-15h30 – Analyses linguistiques et enrichissement des index / Loïc Galand (Univ. Paris 13, LIPN)
15h30-15h45 – [Démo] Archives de l’internet Labs / Peter Stirling (BnF)
15h45-16h15 – [Démo] Fonctionnalités de Néonaute / Emmanuel Cartier (Univ. Paris 13, LIPN)
16h15-16h30 Pause
16h30-17h15 - Exploration des sites de presse archivés à la BnF (2010-2017) (Cas d’étude : méthodologie et premiers résultats) / Animateur : Emmanuel Cartier
16h30-16h50 - Suivi des néologismes et/ou analyse automatique des thèmes / Christophe Gérard (Université de Strasbourg), Nicolas Scarcella (stagiaire)
16h50-17h10 - Termes féminisés / Pierrette Crouzet-Daurat (DGLFLF), Gabrielle Le Tallec (Université Paris 13), Olivia Sanchez (stagiaire)
17h15-18h00 - Table ronde : mise en perspective par Thibault Grouas (DLFLF), Antoine Doucet (Université de La Rochelle, projet européen H2020 NewsEye) et les partenaires du projet.
18h00-19h00 Cocktail
Quelles sont les différentes options de transport ou de parking ?
La manifestation aura lieu sur le site de la BnF dans l’est de Paris :
Bibliothèque nationale de France - Site François Mitterrand
Quai François Mauriac, 75013 Paris
Pour y accéder :
• Par le métro : ligne 14 (station Bibliothèque François Mitterrand). La ligne 14 passe par la station Châtelet pour rejoindre le RER B vers l’aéroport Roissy-Charles-de-Gaulle ainsi que par la station Gare de Lyon pour rejoindre le service de bus d’Air France vers l’aéroport.
• Par bus : lignes 89, 62, 64, 132, 325.
Pour en savoir plus sur les transports publics à Paris : http://www.ratp.fr
• En taxi, à proximité de la BnF : Taxi G7, rue Emile Durkheim (tel: 01 47 39 47 39)
Plan d’accès à la BnF : http://www.bnf.fr/documents/acces_site_mitterrand.pdf
Que puis-je apporter ou non à l'événement ?
En raison du Plan Vigipirate niveau « alerte attentat », vous êtes priés de vous munir d'une pièce d'identité.
Merci de noter que l'entrée Ouest du site François-Mitterrand est fermée, et que seuls les bagages de gabarit dit « cabine » (55cm × 35cm × 25cm) sont acceptés dans l’enceinte des sites de la BnF.
Comment puis-je contacter l'organisateur en cas de question ?
Pour toute demande d'information complémentaire, vous pouvez écrire à depot.legal.web@bnf.fr
Tags
À propos de l'organisateur
En savoir plus sur la mission de dépôt légal du web :
http://www.bnf.fr/fr/professionnels/depot_legal/a.dl_sites_web_mod.html