Félicitations aux gagnants du concours de 2013 de l’initiative Au cœur des données numériques du CRSH!

Digging into Linked Parliamentary Data

(Chercheurs principaux : Maarten Marx, University of Amsterdam, Pays‑Bas; Jane Winters, University of London, Royaume‑Uni; Christopher Cochrane, University of Toronto, Canada)

Ce projet réunit des politicologues, des historiens et des linguistes informaticiens du Canada, des Pays‑Bas et du Royaume‑Uni afin de réaliser une vaste analyse des procédures de trois parlements des années 1800 à aujourd’hui. Les données incluent tous les événements d’importance ayant eu lieu au cours des 200 dernières années et continueront d’être accumulées pendant la durée du projet afin de mieux comprendre l’évolution de différents pays et de divers systèmes et cultures de représentation politique. Le projet permettra de créer un modèle commun et évolutif afin de coder des procédures parlementaires, un ensemble de données conjoint et lié pour les trois gouvernements, une gamme d’outils facilitant l’étude longitudinale des données parlementaires, ainsi qu’une série d’études de cas pour tester et orienter la méthodologie choisie.

Contribution du CRSH : 98 750 $




Global Currents: Cultures of Literary Networks, 1050-1900

(Chercheurs principaux : Elaine Treharne, Stanford University, États‑Unis; Lambert Schomaker, University of Groningen, Pays‑Bas; Andrew Piper, Université McGill, Canada)

Dans le cadre de ce projet, on réalisera une étude interculturelle des réseaux littéraires dans un contexte mondialisé, allant de la philosophie islamique postclassique au siècle des Lumières, en Europe. En intégrant de nouvelles techniques de traitement de l’image dans l’analyse des réseaux sociaux, on examine les réseaux d’échanges intellectuels uniques qui caractérisent chacune des époques culturelles. Bien que la recherche sur la « littérature mondiale » soit devenue un domaine d’études crucial des sciences humaines d’aujourd’hui, les approches guidées par des données en restent à ce jour plutôt absentes. L’approche combinée du traitement du langage visuel et du modelage des réseaux permettra aux chercheurs d’étudier le patrimoine écrit non occidental et de l’ère pré‑imprimerie qui résistait jusqu’ici aux vastes analyses de données ainsi que de concevoir un nouveau modèle de littérature comparative mondiale qui témoigne des différences culturelles dans le monde.

Contribution du CRSH : 124 942 $




Project Arclight: Analytics for the Study of 20th Century Media

(Chercheurs principaux : Eric Hoyt, University of Wisconsin‑Madison, États‑Unis; Charles Acland, Université Concordia, Canada)

Les entreprises médiatiques ont adopté l’analyse computationnelle pour étudier les discussions du contenu médiatique dans l’ensemble des chaînes de données des médias sociaux. Les entreprises d’exploration de données déterminent les acteurs et les émissions de télévision qui ont la cote à l’échelle mondiale et réalisent des analyses plus modulaires des préférences, des réseaux sociaux et des discours régionaux. On propose d’utiliser une méthodologie similaire pour étudier l’histoire des films et des médias. Dans le cadre du projet Arclight, on créera un outil en ligne qui permettra d’étudier les médias américains du 20e siècle en établissant des comparaisons dans le temps et le lieu. Cet outil sera conçu à l’aide de plusieurs technologies de source ouverte populaires, dont Ruby on Rails, Javascript et Solr, et permettra d’analyser environ deux millions de pages de publications du domaine public dérivées de deux organes d’archivage : la Media History Digital Library (qui se sert des services de conservation, d’hébergement et de numérisation d’Internet Archive) et la collection Chronicling America de la Bibliothèque du Congrès.

Contribution du CRSH : 82 760 $




MIning Relationships Among variables in large datasets from CompLEx systems (MIRACLE)

(Chercheurs principaux : C. Michael Barton, Arizona State University, États‑Unis; Tatiana Filatova, University of Twente, Pays‑Bas; Terence P. Dawson, University of Dundee, Royaume‑Uni; Dawn Cassandra Parker, University of Waterloo, Canada)

Des spécialistes des sciences sociales ont utilisé des modèles multiagents pour explorer les interactions et les commentaires des agents sociaux et de leur milieu. La structure ascendante de ces modèles permet de créer des simulations et de faire des recherches très précises portant sur des systèmes complexes et leur comportement. Cependant, la nature stochastique et les combinaisons potentielles des paramètres de tels modèles donnent lieu à des « données massives » multidimensionnelles et non linéaires qui sont difficiles à analyser à l’aide des méthodes statistiques traditionnelles. Le projet vise à résoudre le problème en concevant des algorithmes et des outils de visualisation et d’analyse en ligne qui permettent d’automatiser la découverte des liens complexes qui unissent les variables. Les outils permettront aux modéliseurs de facilement gérer, analyser, visualiser et comparer leurs données de sortie et fournira aux intervenants, aux responsables de l’élaboration de politiques et au grand public des interfaces Web intuitives afin d’explorer des modèles qui seraient autrement difficiles à comprendre, d’interagir avec ces modèles et de formuler des commentaires à leur sujet.

Contribution du CRSH : 125 000 $




Cleaning, Organizing, and Uniting Linguistic Databases (the COULD project)

(Chercheurs principaux : Maria Polinsky, Harvard University, États‑Unis; Alan Bale, Université Concordia, Canada)

Le projet COULD poursuit cinq objectifs : transférer, dans un format universel, les données linguistiques qui existent en divers formats, ce qui permettra aux linguistes de combiner et de partager de l’information non seulement avec d’autres linguistes, mais aussi avec le grand public; concevoir des applications qui corrigeront automatiquement les erreurs, qui signaleront les irrégularités et qui combleront les lacunes des données; fournir, grâce à ces mécanismes, de nouveaux outils pour repérer des tendances qui ne ressortent pas des bases de données plus petites; rendre accessibles aux apprenants de langue seconde la grande quantité des données linguistiques actuellement utilisées seulement par les chercheurs en créant des algorithmes de recherche qui simplifient la création de leçons; faciliter la collecte de données et diminuer la dépendance aux experts en ce qui concerne la préservation et la documentation de la langue. Des collectivités qui tentent de revitaliser des langues en péril profiteront directement de ce projet.

Contribution du CRSH : 125 000 $




Mining Biodiversity

(Chercheurs principaux : William Ulate Rodriguez, Missouri Botanical Garden, États‑Unis; Sophia Ananiadou, University of Manchester, Royaume‑Uni; Anatoliy Gruzd, Dalhousie University, Canada)

Ce projet vise à transformer la Biodiversity Heritage Library en ressource documentaire numérique sociale de demain afin de faciliter l’étude et la discussion, par une communauté mondiale (et par l’intermédiaire des médias sociaux), de documents scientifiques historiques portant sur la biodiversité ainsi que de sensibiliser le grand public aux transformations de la biodiversité au fil du temps. Le projet intégrera des méthodes novatrices d’exploration de textes, de la visualisation, de l’externalisation ouverte et des médias sociaux dans cette Bibliothèque afin de fournir un système de recherche sémantique.

Contribution du CRSH : 125 000 $




Field Mapping: An Archival Protocol for Social Science Research Findings

(Chercheurs principaux : Frank Bosco, Virginia Commonwealth University, États‑Unis; Piers Steel, University of Calgary, Canada)

Dans le cadre de ce projet, des chercheurs des domaines de la psychologie et de la gestion des États‑Unis et du Canada collaboreront avec un spécialiste de la recherche en ligne et des méthodes de classification afin de concevoir une application Web qui permettra de coder des millions de résultats individuels dans un domaine multidisciplinaire de recherche en sciences sociales, facilitera les analyses complexes et fournira un libre accès aux membres de la communauté des chercheurs et au grand public. Le projet fournit des protocoles permettant d’extraire et de classifier des résultats de recherche dans une taxonomie sémantique. Le fondement de cette taxonomie transformera la façon dont les chercheurs trouvent et analysent des résultats à l’aide de données massives. Les chercheurs du projet concevront des algorithmes efficaces pour accéder aux résultats de recherche et les analyser. On pourra ainsi atteindre l’objectif consistant à bâtir un organe complet d’archivage de résultats de recherche en sciences sociales qui est constamment mis à jour et qui répond aux requêtes actives.

Contribution du CRSH : 124 788 $




Digging Archaeology Data: Image Search and Markup (DADAISM)

(Chercheurs principaux : Maarten de Rijke, University of Amsterdam, Pays‑Bas; Helen Petrie, University of York, Royaume‑Uni; Mark Eramian, University of Saskatchewan, Canada)

Des équipes du Royaume‑Uni, du Canada et des Pays‑Bas cherchent une façon d’utiliser la conception interactive de systèmes en combinaison avec des techniques de traitement de l’image et d’exploration de textes afin d’aider les archéologues à trouver, à organiser et à analyser les milliers d’images et de ressources documentaires auxquelles ils ont accès et de leur permettre ainsi de répondre à des questions de recherche liées à l’archéologie.

Contribution du CRSH : 124 965 $




 Contribution totale du CRSH : 931 205 $