L’intelligence artificielle au service de l’épigraphie latine

 

Le 15 avril 2023, le projet Epi2Dap pour « Epigraphic Data Analysis & Data Processing » (Analyse et traitement des données épigraphiques),  lauréat  de l’appel à projet Interdisciplinarité 2021 d’A*Midex, a officiellement démarré pour une période de trois ans.

Il réunit trois partenaires :

      • le Centre Camille Jullian (CCJ UMR 7299, porteur du projet),
      • le  Laboratoire Informatique & Systèmes (LIS UMR 7020),
      • Histoire et sources des mondes anciens (HISOMA UMR 5189).

Le projet porte sur la reconnaissance automatique des formes de lettres gravées sur les inscriptions antiques de Cherchell. Avec l’expertise du LIS, un traitement sera appliqué aux 2000 clichés numérisés de la base de données Open Access EpiCherchell, pour confirmer et affiner les datations proposées par les épigraphistes.
L’établissement d’une chronologie précise par le biais des formes des caractères, des formulaires usités, de l’évolution du libellé en se basant sur un lot d’inscriptions archéologiquement datées permettra d’ancrer l’ensemble des inscriptions dans leur contexte historique et ainsi enrichir l’histoire du territoire. Cette tentative de sérialisation chronologique non supervisée appliquée à ces clichés anciens, uniques et hétérogènes d’un point de vue technique, sera une classification
“objective” des écritures qui sera soumise à l’expertise des épigraphistes d’EpiCherchell et de spécialistes en vue des publications programmées.

Un formalisme permettant la représentation et l’interrogation de l’information produite sera étudié. Il aura pour but d’exprimer les relations spatio-temporelles entre les inscriptions mais aussi d’intégrer les analyses produites par HISOMA au format « Text Encoding Initiative » (XML/TEI). Ce process novateur constituera un modèle d’étude applicable à d’autres corpus et scripts et servira de base pour un atelier doctoral international d’épigraphie digitale qui viendra clôturer les trois années de travail.

Epi2DAP (Epigraphic Data Analysis & Data Processing) focuses on the automatic recognition of letterforms engraved on inscriptions of ancient Cherchell. With the expertise of the LIS, automated processing will be applied to 2,000 digitised images from the OpenAccess EpiCherchell database, to confirm and refine the dating proposed by epigraphists.
The establishment of a precise chronology through the shape of characters, forms used, the evolution of the wording and the integration of archaeologically dated inscriptions will enable the project to anchor all inscriptions in their historical context and considerably enrich the history of the territory. This attempt at unsupervised chronological serialisation applied to these ancient, unique and technically heterogeneous datasets will be an « objective » classification of the writings submitted to the expertise of EpiCherchell’s epigraphists and specialists in the context of programmed publications.
A formalism allowing the representation and interrogation of the information produced will be studied. It will express spatio-temporal relationships between the inscriptions but also integrate existing HISOMA analyses in « Text Encoding Initiative » (XML/TEI) format. This innovative process will thereby constitute a groundbreaking study model applicable to other regions, corpora and scripts. This novel approach will be the basis of an international Doctoral Training Course in Digital Epygraphy that will be held in 2026.