Données statistiques

Microdonnées ou données agrégées ?

  • Fichiers composés d'enregistrements individuels (unités d'observation) auprès desquels des données ont été collectées (individus, ménages, pays, entreprises, ...).
  • Les valeurs (réponses) pour chaque variable (questions) sont compilées dans un fichier de données brutes qui nécessite l'utilisation d'un logiciel d'analyse quantitative (SAS, Stata, SPSS, R,...).
  • Ces fichiers sont ont utilisés à des fins d'analyse ou pour générer des tableaux de données agrégées.
  • Les fichiers de microdonnées à grande diffusion (FMGD) donne accès à un échantillon des données d'enquête anonymisées.
  • Les fichiers maître (données protégées) de Statistique Canada et de l'ISQ sont disponibles sur demande au CIQSS

Fichier de microdonnées de l'EAPA dans SPSS

Fichier de microdonnées de l'Enquête sur la population active (EPA) dans SPSS

  • Les statistiques (ou données agrégées) ont été compilées à partir de données brutes.
  • Ce sont des résumés (vues) de données présentés généralement sous forme de tableaux (fréquence ou croisés) diffusés en différents formats (html, csv, excel).
  • On les utilise donc à des fins descriptives. 

Tableau de l'Enquête sur la population active (EPA)

Tableau de staitstiques de l'Enquête sur la population active (EPA): Caractéristiques de la population active selon le diplôme scolaire

Données primaires ou secondaires?

Données primaires:

Données originales produites par le chercheur pour répondre à ses questions de recherche (par exemple les données produites par un étudiant dans le cadre de sa recherche doctorale)

Données secondaires:

Données collectées par un chercheur/organisme réutilisées par un autre chercheur pour répondre à ses propres besoins de recherche (par exemple un chercheur utilise les données du recensement pour répondre à ses questions de recherche portant sur l'impact du niveau de scolarité sur le revenu).

Avantages et désavantages des données secondaires
AvantagesDésavantages
Complément ou substitut aux données primaires pour contextualiser recherche, préparer enquête et valider donnéesNe pas permettre le contrôle de l’opérationnalisation des concepts, du choix de variables, des questions posées.
Économie de temps et d’argentOrienter la recherche
Ajouter une perspective temporelle ou comparativeImpliquer des données qui datent
Disposer de plus grands échantillonsImpliquer des données mal documentées pour lesquelles la qualité est difficile à vérifier
 Impliquer des données difficiles d’accès

 

Données administratives ou données d'enquêtes?

Données compilées dans le cadre d'une collecte d'information à propos des caractéristiques des unités d'une population. L'enquête se distingue d'un recensement car elle porte sur un échantillon et non sur une population totale (on parle parfois d'enquête-échantillon). Elle peut être menée par des organisations gouvernementales, des organismes sans but lucratifs, des chercheurs universitaires,...

Les enquêtes peuvent être transversales (portrait des répondants à un moment x) ou longitudinales (observations répétées des mêmes répondants sur une période donnée).

Par exemple:

 

Pour en savoir plus sur les sources de données

Données colligées par une agence gouvernementale ou tout organisme/institution des secteurs public ou privé dans le cadre de ses opérations. Ces données sont compilées à des fins administratives mais elles sont de plus en plus traitées et utilisées à des fins de recherche. Elles peuvent être diffusées publiquement (données anonymisées agrégées) ou disponibles sur demande à des fins de recherche.

Par exemple:

Évaluez les données

Avant d'utiliser/analyser des données secondaires, quelques questions à se poser…

  • Qui a réalisé l’enquête/collecte de données ? (sources officielles/non-officielles, autorité, fiabilité)
  • Quel était l’objectif de l'enquête ? (intention, objectivité/partialité)
  • Période couverte : Une année en particulier ou plusieurs années? Données non mises à jour?
  • Quand et comment les données ont-elles été collectées (méthode de collecte) ?
  • Quelle population a été étudiée ? (Unités - Population cible/observée: Famille, ménage, individu, entreprise?)
  • Niveau géographique: Pays, province, ville, quartier?
  • Quels sont les types de données et formats de variables mesurés ?
  • Quels tests souhaitez vous effectuer? -> Which Stats Test