Aurélien Pellet

Explorer les débats parlementaires français de la troisième république par leurs sujets

By Marie Puren, Aurélien Pellet

2023-06-01

In Humanistica 2023

Abstract

Cet article compare trois méthodes pour explorer de grands corpus de documents historiques par leurs sujets. Nous travaillons ici sur les débats parlementaires franais de la Troisième République, qui se prêtent particulièrement bien à ce type d’analyse. Après avoir présenté le contexte de cette étude, nous exposons les résultats obtenus avec trois méthodes issues du traitement automatique des langues et appliquées sur des textes publiés entre 1876 et 1914 : l’allocation de Dirichlet latente, les plongements de mots et le Transfer Learning.

Continue reading

From parliamentary history to digital and computational history: A NLP-friendly TEI model for historical parliamentary proceedings

By Marie Puren, Fanny Lebreton, Aurélien Pellet, Pierre Vernus

1970-01-01

In Digital Scholarship in the Humanities

Abstract

This article introduces a new method for the digital and computational analysis of historical parliamentary proceedings. The article presents an XML-TEI model specifically designed for encoding historical parliamentary documents; this model is exemplified through the analysis of parliamentary debates from the French Chamber of Deputies (1889-1893). The first part of the article discusses the motivations behind the model’s development. The second part outlines the methodological choices in constructing the model and the need for schema adaptation. We subsequently detail our method for automatic encoding of such large corpora. Finally, we propose an approach to annotate parliamentary debates using natural language processing analyses, focusing on topic modelling.

Continue reading