eScriptorium

Informations
Dernière version	V1.0.0 (30 janvier 2026)
Dépôt	gitlab.com/scripta/escriptorium
Écrit en	Python, JavaScript et HTML
Système d'exploitation	GNU/Linux et macOS
Formats lus	ALTO-XML (d), PAGE (XML) et Portable Document Format
Formats écrits	ALTO-XML (d), PAGE (XML), TEI/XML (d) et fichier texte
Type	Application web; Logiciel à sources consultables (en)
Licence	Licence MIT

Cet article est une ébauche concernant un logiciel.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

eScriptorium est une plateforme de segmentation et de reconnaissance de texte manuelle ou automatisée pour les manuscrits et imprimés historiques.

Description

eScriptorium est un logiciel open source développé à l'Université Paris Sciences et Lettres dans le cadre des projets Scripta^[2] et RESILIENCE^[3] avec des contributions d'autres institutions. Il est partiellement financé par le programme de financement Horizon 2020 de l'Union européenne et une subvention de la fondation Andrew W. Mellon (en).

Les images numérisées de manuscrits ou d'imprimés importées dans eScriptorium sont exportées sous forme de texte dans différents formats (texte, ALTO ou PAGE XML, TEI). La segmentation des zones et lignes de texte à l'intérieur des images est manuelle ou automatique. Les lignes de texte sont ensuite elles-mêmes transcrites manuellement ou automatiquement^[4].

La segmentation automatique et la reconnaissance de texte automatique peuvent toutes deux être entraînées à l'aide d'exemples créés ou corrigés manuellement (ground truth (en) ou « vérité terrain » en français). Les modèles ainsi créés sont faciles à partager et réutiliser^[5].

eScriptorium s'appuie sur un logiciel de reconnaissance optique de caractères, le logiciel libre Kraken de Benjamin Kiessling, dérivé d'OCRopus, qui convient aux textes manuscrits et imprimés et prend en charge des écritures qui s'écrivent de droite à gauche telles que l'hébreu et l'arabe^[6].

Ses fonctions sont similaires à celles de programmes comparables tels qu'OCR4All^[7] et Transkribus.

Notes et références

Sur les autres projets Wikimedia :

eScriptorium, sur Wikimedia Commons

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « eScriptorium » (voir la liste des auteurs).

↑ « Release eScriptorium v1.0.0 — first stable release featuring the new UI, Kraken 6 support and other features » (consulté le 7 février 2026)
↑ (en) « Scripta-PSL. History and practices of writing » (consulté le 13 mars 2022)
↑ (en) « RESILIENCE - The Religious Studies Research Infrastructure » (consulté le 13 mars 2022)
↑ « eScriptorium Documentation » (consulté le 21 janvier 2024)
↑ « Export data - eScriptorium Documentation » (consulté le 21 janvier 2024)
↑ (en) « lunch/kraken: OCR engine for all the languages » (consulté le 13 mars 2022)
↑ « OCR4all | forTEXT » (consulté le 20 juin 2023)

Voir aussi

Portail d’Internet

[wikidata-a7d23ad761013058554bc98e4634aae4419116a3-1] « Release eScriptorium v1.0.0 — first stable release featuring the new UI, Kraken 6 support and other features » (consulté le 7 février 2026)

[2] (en) « Scripta-PSL. History and practices of writing » (consulté le 13 mars 2022)

[3] (en) « RESILIENCE - The Religious Studies Research Infrastructure » (consulté le 13 mars 2022)

[4] « eScriptorium Documentation » (consulté le 21 janvier 2024)

[5] « Export data - eScriptorium Documentation » (consulté le 21 janvier 2024)

[6] (en) « lunch/kraken: OCR engine for all the languages » (consulté le 13 mars 2022)

[7] « OCR4all | forTEXT » (consulté le 20 juin 2023)

[1]

[2]

[3]

[4]

[5]

[6]

[7]