Voyant Tools
| Développé par | Stéfan Sinclair et Geoffrey Rockwell |
|---|---|
| Première version | |
| Dernière version | 2.2 |
| Dépôt | https://github.com/voyanttools/Voyant |
| Langues | Disponible en 10 langues |
| Type | Analyse de données textuelles, analyse statistique, exploration de données |
| Licence |
Web Application: Creative Commons Attribution 4.0 International Code: GPL3 |
| Documentation | https://voyant-tools.org/docs/tutorial-guides.html |
| Site web | http://voyant-tools.org/ |
Voyant Tools est une application web open source qui permet d'effectuer des analyses de données textuelles. Elle facilite la lecture et l'interprétation de textes ou de corpus, notamment par les chercheurs en humanités numériques, mais aussi par les étudiants et le grand public. Elle permet d'analyser des textes en ligne ou des textes téléchargés par les utilisateurs[1]. Voyant Tools bénéficie d'une large base d'utilisateurs internationaux. Pour le mois d'octobre 2016, son serveur principal a enregistré 81 686 pages consultées provenant de 156 pays, nécessitant 1 173 252 utilisations de l'outil[2].
Voyant Tools a été conçu pour améliorer le processus de lecture textuel grâce à différents outils, tels que des listes de fréquences de mots, des diagrammes de distribution de fréquences et des onglets d'affichages des termes dans leurs contextes (KWIC)[3]. Son interface est composée de panneaux effectuant ces diverses tâches d'analyse. Ces panneaux peuvent également être intégrés à des textes web externes. Un article web peut, par exemple, inclure un panneau Voyant Tools et créer ainsi un nuage de mots. L'ouvrage Hermeneutica : Computer-Assisted Interpretation in the Humanities présente différentes approches de l'analyse de texte avec Voyant[4].
Histoire
[modifier | modifier le code]Voyant Tools a été développé par Stéfan Sinclair, professeur à l'Université McGill et Geoffrey Rockwell professeur à l'Université de l'Alberta. Il est continuellement mis à jour. Il s'appuie sur des outils d'analyse de texte antérieurs, notamment HyperPo, Taporware et TACT. Andrew MacDonald, Cyril Briquet, Lisa Goddard et Mark Turcato y ont également contribué[1].
Utilisations
[modifier | modifier le code]Les chercheurs utilisent Voyant Tools pour analyser des textes dans différents domaines, notamment la littérature[5], l'enseignement des langues[6], la santé[7],[8], et l'architecture des systèmes numériques[9]. Décrivant les approches d'étude d'Internet utilisant le web scraping, Black a noté que « le projet Voyant Tools est une excellente source pour en savoir plus sur les types de données que les humanistes peuvent extraire de sources Internet, car il prend déjà en charge l'extraction de texte à partir de pages Web[10]. »
Plusieurs projets internationaux en humanités numériques utilisent Voyant Tools sur leurs propres serveurs. Parmi eux, le projet français Huma-Num, le projet italien CNR ILC et le projet allemand DARIAH-DE[2].
Liens externes
[modifier | modifier le code]- Voyant Tools
- Dépôt Voyant Tools sur GitHub
Références
[modifier | modifier le code]- « Voyant Tools Help », voyant-tools.org (consulté le )
- Sinclair et Rockwell, « Voyant Facts », Hermeneuti.ca: Computer-Assisted Interpretation in the Humanities, Stéfan Sinclair & Geoffrey Rockwell, (consulté le )
- ↑ Klein, Eisenstein et Sun, « Exploratory Thematic Analysis for Digitized Archival Collections », Digital Scholarship in the Humanities, vol. 30, no Supp. 1, , i138 (DOI 10.1093/llc/fqv052)
- ↑ Geoffrey Rockwell et Stéfan Sinclair, Hermeneutica: Computer-Assisted Interpretation in the Humanities., Cambridge, MIT Press, (ISBN 9780262332057)
- ↑ Rambsy, « Text-Mining Short Fiction by Zora Neale Hurston and Richard Wright using Voyant Tools », CLA Journal, vol. 59, no 3, , p. 251–258
- ↑ McIlroy, « Exploring Poetry and Identity in a Language Learning Environment », Studies in Linguistics and Language Teaching, vol. 24, , p. 31–45
- ↑ De Caro, Mitello, Marucci et Lancia, « Textual Analysis and Data Mining: An Interpreting Research on Nursing », Studies in Health Technology and Informatics, vol. 225, , p. 948 (PMID 27332424)
- ↑ Maramba, « Web-based textual analysis of free-text patient experience comments from a survey in primary care », JMIR Medical Informatics, vol. 3, no 2, , e20 (PMID 25947632, PMCID 4439523, DOI 10.2196/medinform.3783)
- ↑ Moullec, Jankovic et Eckert, « Selecting system architecture: What a single industrial experiment can tell us about the traps to avoid when choosing selection criteria », System Architecture Design, vol. 30, no 3, , p. 250–262
- ↑ Black, « The World Wide Web as Complex Data Set: Expanding the Digital Humanities into the Twentieth Century and Beyond through Internet Research », International Journal of Humanities and Arts Computing, vol. 10, no 1, , p. 106 (DOI 10.3366/ijhac.2016.0162)