Numérisation et analyse de documents. Pour une lecture intertextuelle des données massives

Cette recherche vise à montrer l’intérêt d’une lecture intertextuelle des ensembles de données massives (big data), à même de compenser l’incapacité des approches quantitatives et automatisées à remplir certaines promesses, en particulier face à l’indépassable subjectivité du rapport au texte. On verra ainsi que l’origine commerciale de la notion de données massives participe d’une définition plus marketing que scientifique, à trop vouloir considérer différentes dans leur nature des données qualitatives dont la seule spécificité est en fait leur support numérique. On contestera à ce titre les prétentions à une quel-conque représentativité statistique et à une quelconque objectivité dans leur analyse, liées notamment à une confusion dommageable entre la simulation et la réalité simulée. On réfutera de plus la nécessité d’importer en sciences humaines et sociales les définitions des notions de « donnée » ou d’« information » issues du domaine de l’informatique, en invitant à une approche plus conforme au caractère incrémental et itératif du processus d’analyse. On reviendra enfin sur le fétichisme de la technologie sur lequel se fondent les prétentions hégémoniques des humanités numériques, pour leur opposer l’alternative d’une lecture intertextuelle à même d’ouvrir à davantage d’investissement qualitatif des terrains de recherche numériques.

Ce contenu a été mis à jour le 11 février 2020 à 15 h 59 min.