NER for OCR’ed historical documents in Paris
Nous sommes un groupe de chercheurs travaillant sur la reconnaissance d’entités nommées, et plus généralement l’extraction et la consolidation de données structurées contenues dans les documents historiques.
Nous organisons régulièrement un séminaire (diffusé en ligne) suivi d’une session d’échange pour les participants présents sur place (généralement à la Maison de la Recherche, 28 rue Serpente, 75006 Paris).
Nous proposons également une liste de diffusion dans laquelle nous annonçons les séminaires à venir, et pour partager des articles, des codes, des modèles, des données, des appels à participation, et toute autre information utile en rapport avec :
- la reconnaissance d’entités nommées dans les documents historiques, pendant ou après transcription automatique
- l’intégration de connaissances (lexicales, linguistiques, ontologiques, etc.) permettant de guider ou corriger les éléments reconnus
- les mesures et outils permettant l’évaluation de la performance de ces systèmes
- les jeux de données ouverts, ainsi que les méthodes et outils permettant de les produire
- les techniques de liage, de représentation sous forme de graphe de connaissance, de dédoublonnement, d’indexation, etc. permettant la consolidation des bases de données produites
- les méthodes et outils de visualisation des données produites
- ou tout autre aspect que vous jugerez pertinent.
Contenu de cette page
Liste de diffusion
Vous pouvez consulter la page suivante pour vous inscrire et vous désinscrire librement : https://groupes.renater.fr/sympa/info/ner-for-historical-docs
Cette liste est modérée ; nous veillons au respect du thème de la liste lors de l’envoi de messages, ainsi qu’à la bonne conduite des membres. Nous n’accepterons aucun message discriminatoire, stigmatisant ou comportant des attaques personnelles, en encourageons les informations d’intérêt collectif et les contributions constructives.
Prochains séminaires
Lieu et horaire
Les séminaires ont lieu en hybride de 12h à 13h pour chaque date indiquée
- en visio (lien confirmé quelques jours avant chaque séminaire)
- et à la Maison de la Recherche de Sorbonne Université, au 28 rue Serpente, 75006 Paris (consultez l’écran à l’entrée la maison de la Recherche pour vérifier la salle)
📍 Afficher le lieu sur OpenStreetMap | Google Maps
Format des sessions
- Présentation invitée sans interruption pour faciliter le mode hybride pendant 40-50 minutes.
- Questions et réponses pendant 10-20 minutes.
- Présentations flash de résultats récents en forme d’incitations à collaborer. N’hésitez pas à préparer 1 slide pour servir de support visuel ! Toutes les contributions sont les bienvenues.
- Discussions libres jusqu’à la fin du créneau.
Calendrier
Vous pouvez visualiser rapidement les prochains événements sur ce calendrier. Vous pouvez également vous y abonner avec le client ou le service de votre choix.
Séminaires à venir
Planification en cours.
Abonnez-vous à notre liste de diffusion 📧 pour être averti(e) des prochains séminaires.
Séminaires passés
Date | Intervenant(e)(s) | Titre | Détails |
---|---|---|---|
30 mai 2024 | Florence Clavaud, Responsable du Lab aux Archives nationales de France, et membre de l’équipe de recherche EA 3624 (Centre Jean-Mabillon) de l’Ecole nationale des chartes, et Cecilia Graiff, Ingénieure de recherche chez INRIA dans l’équipe ALMAnaCH | NER4Archives : reconnaître, réconcilier et identifier les entités nommées dans les instruments de recherche archivistiques au format EAD | description / slides |
28 mars 2024 | Solène Tarride (Dr, Ingénieure chez Teklia) | Extraction d’informations structurées dans des documents historiques | description / slides |
16 novembre 2023 | Thierry PAQUET, LITIS (Professeur, Université de Rouen, Directeur du LITIS) et Denis COQUENET, IRISA (MCF, Université de Rennes) et Thomas CONSTUM, LITIS (Doctorant, Université de Rouen) | Approches pour la reconnaissance d’écriture et la reconnaissance d’entités nommées | |
19 octobre 2023 | Thierry Poibeau (directeur de recherche au CNRS - directeur adjoint du laboratoire LATTICE) | “Analyser les entités dans les romans pour détecter des tendances historiques (grâce au projet BookNLP)” | description / slides / vidéo |
17 mars 2023 | Carmen Brando Lebas (Dr et ingénieure de recherche en Humanités numériques à l’EHESS) et Frédérique Mélanie-Becquet (Ingénieure d’études CNRS en production, traitement et analyse de données au Lattice) | Annuaires de propriétaires et des propriétés de Paris (1898, 1903, 1913, 1923) : du papier à la carte | description |
16 septembre 2022 | Antoine Doucet (Professeur, Université de La Rochelle, L3I) et Emanuela Boros (Docteure, Ing. Recherche à l’Univ. La Rochelle, L3I) | Impact de la reconnaissance optique des caractères sur la reconnaissance des entités nommées | |
7 juillet 2022 | Organisateurs séminaire | Session d’introduction |
Comité d’organisation
Les activités de ce groupe de travail sont organisées par les personnes suivantes (par ordre alphabétique) :
- Nathalie Abadie : chargée de recherche, LaSTIG/IGN
- Joseph Chazalon : enseignant chercheur, LRE/EPITA
- Bertrand Duménieu : ingénieur de recherche, CRH/EHESS
- Christopher Kermorvant : directeur, TEKLIA
- Gaël Lejeune : maître de conférences HDR, STIH/Sorbonne Université
- Caroline Parfait : doctorante, ObTIC/Sorbonne Université