*Inscriptions fermées* École ATO 2020 : Formation intensive en analyse de texte assistée par ordinateur
11 septembre 2020 30 octobre 2020
En ligne
Veuillez noter qu’en date du 31 juillet 2020, le cours est complet et les inscriptions sont fermées.
Présentation
Avec la croissance exponentielle des documents textuels en format numérique, la recherche dans les sciences humaines et sociales (SHS) nécessite une plus grande maîtrise des modèles, méthodes et outils computationnels d’analyse de textes. Plusieurs disciplines en SHS s’intéressent à ces techniques : l’histoire, la sociologie, l’anthropologie, la philosophie, les sciences politiques, la psychologie, la linguistique, la sémiotique ou encore la philologie. Or l’apprentissage de ces savoir-faire est peu accessible dans ces cursus disciplinaires.
La formation intensive ici proposée sera donnée en mode laboratoire. Elle vise à répondre au besoin grandissant des étudiant.e.s des SHS quant à l’acquisition de l’ensemble des compétences nécessaires à l’analyse de corpus de textes numériques : collecte de données, prétraitement, modélisation computationnelle, analyse et visualisation des résultats.
À raison d’une journée d’apprentissage pratique par semaine pendant 8 semaines (du 11 septembre au 30 octobre 2020), cette formation intensive et individualisée est offerte à un groupe restreint d’étudiant.e.s qui bénéficieront de l’enseignement et du soutien d’experts situés à l’intersection des sciences humaines et de l’informatique. Un ratio moniteurs/étudiant.e.s très élevé permettra aux participant.e.s de mieux appliquer les acquis à leur propre corpus.
***Veuillez noter que le cours se donnera le vendredi et non le jeudi tel qu’annoncé initialement.
Compte tenu des mesures de distanciation physique, le cours se donnera en ligne.***
Objectifs
L’objectif principal de cette formation est d’initier à l’analyse de texte assistée par ordinateur (ATO) une nouvelle génération d’étudiant.e.s et de démystifier l’usage de certains outils informatiques développés en fouille de texte (Text Mining) pour la recherche en SHS. C’est pourquoi cette formation poursuit les objectifs généraux suivants :
- Fournir une formation académique enseignant les bases techniques et théoriques de l’ATO nécessaires à sa pratique
- Favoriser la formation d’étudiant.e.s adaptés aux humanités numériques
- Décloisonner l’usage des outils en ATO pour les SHS
Au terme de cette formation, les étudiant.e.s inscrit.e.s devraient :
- Avoir une vue d’ensemble des techniques de l’ATO
- Comprendre pourquoi et comment les sciences humaines s’intéressent à l’ATO
- Analyser un corpus en utilisant les techniques de l’ATO
- Savoir distinguer les différentes dimensions d’analyse d’un corpus (métadonnée, document, structure d’un document, annotation, unité lexicale)
- Savoir appliquer les techniques et outils en ATO à différents corpus de recherche
- Se familiariser avec les méthodologies de l’analyse de textes assistée par ordinateur (fouille de textes) et l’ensemble des opérations d’une chaîne de traitement: collecte de données, prétraitement, modélisation, analyse, interprétation et visualisation
- Maîtriser les rudiments de la manipulation de scripts dans le langage de programmation R
- Se familiariser avec l’interopérabilité des données (importation/exportation) entre différents environnements
Programmation préliminaire
Jour 1 | Jour 2 | Jour 3 | Jour 4 |
Présentations générales sur l’ATO et sur l’environnement de développement R Studio | Introduction au langage R et initiation à l’analyse univariée en ATO | Collecter, préparer, décrire et annoter un corpus à des fins d’analyse | La sémantique vectorielle et ses unités d’analyse; Méthodes d’explorations et bivariées (co-occurrences) sur les unités lexicales. |
Jour 5 | Jour 6 | Jour 7 | Jour 8 |
L’analyse des spécificités lexicales et recherche d’information; Séance de monitorat | L’apprentissage automatique non-supervisé : méthodes de clustering pour l’ATO | La réduction dimensionnelle et l’analyse des correspondances et évaluation | Topic model, analyse sémantique automatisée, analyse diachronique et croisement entre méthodes |
Équipe
Comité organisateur
- Davide Pulizzotto, associé de recherche à Polytechnique Montréal et chercheur postdoctoral au CIRST (UQAM)
- Maxime Sainte-Marie, chercheur postdoctoral au Danish Center for Studies on Research and Research Policy (Université d’Aarhus) et professeur associé au CIRST
- Élias Rizkallah, professeur de sociologie à l’UQAM et directeur du Centre ATO (UQAM)
- Jean-François Chartier, professeur associé au CIRST
Collaborateurs
- Francis Lareau, doctorant en informatique cognitive à l’UQAM
- Jean-Guy Meunier, professeur au Département de philosophie de l’UQAM et membre titulaire de l’Académie internationale de philosophie des sciences
- François Claveau, professeur au Département de philosophie de l’université de Sherbrooke et titulaire de la Chaire de recherche du Canada en épistémologie pratique
- Christophe Malaterre, professeur au Département de philosophie de l’UQAM et titulaire de la Chaire de recherche du Canada en philosophie des sciences de la vie
Partenaires de l’École ATO 2020
- CIRST
- 4POINT0 (Polytechnique Montréal)
- Centre ATO (UQAM)
- Danish Center for Studies on Research and Research Policy (Université d’Aarhus)
- Chaire de recherche du Canada en épistémologie pratique (Université de Sherbrooke)
- Laboratoire de philosophie des sciences (UQAM)
Contact
Pour toute information, contacter: ecoleato@gmail.com
INSCRIPTION – INFORMATION
Veuillez noter qu’en date du 31 juillet 2020, le cours est complet et les inscriptions sont fermées.
Deux modes d’inscription existent pour ce cours :
1) cours crédité (FSH8050) de maîtrise (2e cycle) ou de doctorat (3e cycle)
2) formation libre.
1) Modalités d’inscription comme cours crédité
Le cours FSH8050 est un cours offert par la Faculté des sciences humaines de l’UQAM.
Inscription
Pour les étudiants de l’UQAM, la proédure est la même que pour un cours facultaire. La personne ressource à la Faculté des sciences humaines est madame Chantal Vézina (vezina.chantal@uqam.ca).
Ce cours peut être ajouté à votre cursus de maîtrise ou doctorat. Renseignez-vous auprès de votre département.
Les étudiant.e.s des autres universités québécoises doivent faire leur demande d’inscription sur le site du BCI (entente interuniversitaire).
Admissibilité
Voici les conditions d’accès à ce cours :
- Être inscrit.e dans un programme de maîtrise ou de doctorat à l’UQAM ou ailleurs au Québec
- Posséder quelques notions de programmation informatique ou être intéressé.e à les apprendre
- Posséder des connaissances de base en statistiques descriptives et inférentielles
Sélection
Aucune sélection n’est effectuée. Toutefois, le nombre de places disponibles est limité.
Frais
Les frais applicables sont ceux correspondant à un cours de trois crédits.
2) Modalités d’inscription en formation libre
Même si l’école ATO 2020 est principalement dédiée à la formation d’étudiant.e.s, d’autres profils sont aussi acceptés. Les consignes qui suivent ne s’appliquent qu’à celles et ceux qui comptent s’inscrire en formation libre (voir plus haut les consignes pour ceux et celles qui souhaitent obtenir des crédits pour ce cours).
Inscription
Pour s’inscrire, il est nécessaire d’envoyer un courriel à ecoleato@gmail.com, avec comme objet Inscription formation libre et en pièce jointe les trois documents suivants :
- Curriculum vitae : formation antérieure, expérience de recherche, compétence en statistiques et en informatique, s’il y a lieu
- Lettre de motivation : pourquoi suivre l’école ATO 2020 ?
- Numérisation de la preuve d’inscription de 2e / 3e cycle OU d’affiliation à un établissement (université, collège, organisme privé, gouvernemental ou sans but lucratif), le cas échéant.
Admissibilité
Les conditions d’admissibilité et la procédure de sélection s’appliquent uniquement aux personnes qui désirent s’inscrire à la formation libre.
- Les candidat.e.s inscrit.e.s à la maîtrise ou au doctorat dans une université québécoise auront préséance sur les autres types de profils.
- Indiquer clairement les besoins qui incitent à participer à la formation ainsi que l’intérêt pour l’étude du langage (fouille d’opinion, sociolinguistique, analyse de discours, sentiment analysis, analyse de contenu, etc.)
- Avoir suivi un cours de base en statistiques descriptives (moyenne, écart-type, pourcentage, médiane, etc.)
- Compétences informatiques de base :
- Traitement de texte : copier-coller, rechercher-remplacer, raccourcis clavier, etc.
- Gestion de fichiers : opérations de tri, nomenclature de fichier/dossier, extension de fichier, etc.
- Connaissance minimale de Excel ou Calc : copier-répéter (poignée de recopie), opérations de tri et de filtrage, etc.
- Être intéressé.e par la programmation informatique de base
- Une bonne connaissance du français est exigée, puisque les séances sont exclusivement en français
- Avoir un corpus spécifique d’analyse est un atout
Sélection
Chaque candidature (en formation libre seulement) sera évaluée par le comité organisateur de la formation. Ce comité se réserve le droit de choisir les candidat.e.s en fonction des objectifs de recherche et de formation visés par la formation. Les candidat.e.s retenu.e.s seront contacté.e.s dans les plus brefs délais après la date limite de dépôt des demandes. Les candidat.e.s retenu.e.s devront suivre la procédure indiquée dans la prochaine section pour être définitivement admis.e.s à l’école ATO 2020.
Frais
Pour l’admission en formation libre, l’école ATO 2020 est offerte gratuitement, grâce au soutien du Conseil de recherches en sciences humaines (CRSH). Toutefois, les personnes sélectionnées devront envoyer un chèque de 200$, qui leur sera rendu à la mi-session. Le chèque de dépôt doit être fait à l’ordre de l’Université du Québec à Montréal et envoyé à :
CIRST
Université du Québec à Montréal
C.P. 8888, succ. Centre-ville
Montréal (Québec)
H3C 3P8
Les organisateurs du cours n’offrent aucun soutien logistique ou financier pour le déplacement, l’hébergement ou la nourriture des candidat.e.s.
Dates importantes (formation libre seulement)
- Soumission de dossier : 15 juillet 2020
- Annonce du premier tour : 1er août 2020
- Confirmation d’inscription par les candidat.e.s par envoi du chèque : avant le 15 août 2020
Ce contenu a été mis à jour le 31 juillet 2020 à 9 h 55 min.