Canalblog
Suivre ce blog Administration + Créer mon blog

le statisticien

2 avril 2018

Traitement et analyse des données d'enquête

Le traitement et l’analyse des données statistiques exigent trois types de compétences : les compétences en statistique, en analyse de données et en informatique.

Traitement des données

Le traitement des données est une étape indispensable pour une analyse des données. Il permet de bien préparer les données avant l’analyse.

Les principales opérations qui interviennent dans le processus du traitement des données sont :

  • Le codage des données :

-     Les classes d'intervalles : elle consiste à mettre les données en classe d’intervalle,

-     Le regroupement de modalités : lorsqu’une variable qualitative a plusieurs modalités, vous pouvez les regrouper pour obtenir un nombre de modalités plus réduit,

-     Le codage des modalités : cette opération consiste à donner des codes (0, 1, 2 …) aux modalités des variables. Il est important de respecter l’ordre croissant des codes lorsque les modalités sont ordinales.

  • Le calcul des indices et des scores : Cette opération permet obtenir des indicateurs pertinents (indice de satisfaction, niveau de compétence, note d'évaluation...) à partir de l’agrégation de deux ou de plusieurs autres indicateurs. Ce sont des indicateurs composites.
  • Le redressement des données : Il permet d’obtenir un échantillon représentatif en supprimant des individus (plusieurs critères, parmi lesquels le taux élevé de valeurs manquantes, peuvent conduire à supprimer un individu) ou en attribuant un poids particulier aux répondants en fonction de leur catégorie et des objectifs de l'enquête (c’est la pondération).

Analyse des données

L’analyse des données repose sur l’utilisation de techniques statistiques. Ici, on fait recours à l’utilisation des statistiques descriptives et/ou des statistiques inférentielles.

Les statistiques descriptives permettent de décrire et de présenter les données. Il s’agit des caractéristiques de tendance centrale (moyenne, mode, médiane) et des caractéristiques qui révèlent l’allure de la distribution (étendue, écart-type, symétrie ou aplatissement). Il faut noter que ces caractéristiques ne s’appliquent que sur des variables quantitatives. Pour les variables qualitatives, on fait référence aux tableaux de contingence. En plus de ces caractéristiques, il faut associer les graphiques adaptés selon le type de variable.

L’analyse dite exploratoire est généralement classée comme prolongement de la statistique descriptive. Il s’agit d’un ensemble de techniques qui ont pour objet de faciliter la visualisation des données, de révéler leur structure sous-jacente et d’extraire certaines variables importantes. Les méthodes d’analyse exploratoire les plus utilisées sont : l’analyse factorielle en composantes principales, l’analyse des correspondances et l’analyse hiérarchique.

NB : les statistiques descriptives ne permettent pas de faire d’inférence ou de prédiction à partir des données recueillies. Elles rapportent simplement les résultats sous une forme synthétique qui facilite leur interprétation.

Les statistiques inférentielles permettent de réaliser des inférences et des prédictions à partir des données rassemblées. Il existe de nombreuses techniques inférentielles qui permettent de tester des hypothèses en comparant des moyennes ou des variances ou encore de vérifier le lien entre les variables. Parmi ces techniques, on compte les techniques de corrélation, de chi2 et de régression.

Publicité
Publicité
1 avril 2018

Collecte des données primaires

"Ce document vous propose un guide pour la collecte des données primaires"

Introduction

Les données primaires sont spécialement collectées pour répondre à une étude statistique précise. Elles s'opposent aux données secondaires. Ces dernières sont des données qui existent déjà au moment de votre étude et qui ont été collectées pour des raisons qui peuvent être différentes de celles de votre étude.

Pour procéder à la collecte des données primaires, la procédure efficace exige les phases suivantes:

  • Définir les objectifs de l'étude,
  • Déterminer la population d'étude,
  • Construire l’échantillon,
  • Determiner la taille de l'échantillon,
  • Choisir la méthode de sondage,
  • Créer le questionnaire,
  • Faire le pré-test,
  • Administrer le questionnaire.

 A.    Définir les objectifs de l’étude

La collecte des données est toujours relative à une étude. Ainsi, la connaissance des objectifs de l’étude est indispensable pour toute la procédure de collecte des données.

B.     Déterminer la population d’étude

La population d’étude ou de référence est la population sur laquelle porte l'enquête et donc à laquelle on souhaite généraliser les résultats obtenus sur l'échantillon.

Il faut définir clairement la population à étudier en tenant compte des critères physiques, géographiques, etc.

C.    Construire l’échantillon

Le mode de sélection de l’échantillon peut être aléatoire ou non aléatoire

  •   La méthode aléatoire ou probabiliste fait appel au hasard. Parmi les méthodes aléatoires, les plus courantes sont :

      -  la méthode aléatoire simple : les individus de la population ont tous les mêmes chances d’appartenir à l’échantillon. Cette méthode est employée lorsque la population est homogène suivant les critères retenus pour définir les individus statistiques.

     -  la stratification : on fait appel à cette méthode lorsque la population peut être subdivisée en sous-groupes homogènes. Elle consiste donc à choisir un échantillon représentatif dans chaque sous-groupe, et l’ensemble des sous échantillons retenus des différents sous-groupes qui constitue l’échantillon de base.

     -  La méthode en grappe. La technique de l'échantillonnage en grappes entraîne la division de la population totale en groupes (encore appelés en grappes). Suivant cette technique, on sélectionne au hasard un certain nombre de grappes pour représenter la population totale, puis on englobe dans l'échantillon toutes les unités incluses à l'intérieur des grappes sélectionnées. Aucune unité provenant d’une grappe non sélectionnée ne peut faire partir de l’échantillon.

  •   La méthode empirique ou non probabiliste ne fait pas intervenir le hasard. On l’appelle aussi méthode de convenance. On distingue la méthode par quotas, la méthode à priori, etc. cette méthode à l’avantage de tenir compte des contraintes de terrain.

D.   Déterminer la taille de l'échantillon

La détermination de la taille de l’échantillon dépend de plusieurs paramètres : la taille de la population, l’espace géographique à couvrir, ainsi que les ressources financières allouées pour la collecte des données. Cependant, il faut toujours s’assurer que l’échantillon est représentatif.

Lorsque la taille de la population n’est pas grande (généralement inférieur à 1000), il est conseillé d’administrer le questionnaire à toute la population.

Plus la taille de la population est grande, plus la proportion de l’échantillon (taille de l’échantillon rapportée à la taille de la population) est faible.

E.  Méthode de sondage

On distingue : le sondage par téléphone, le sondage en face à face, le sondage assisté par ordinateur, le sondage par correspondance et le sondage par internet.

F.   Créer le questionnaire

1.  Objectif du questionnaire

Le questionnaire vise à traduire l’information en questions, structurer les informations,  minimiser les erreurs et les biais.

2.  Méthode du questionnaire

Pour monter un bon questionnaire, il faut : lister les informations, définir le contenu et la structure des questions, formuler les questions et les ordonner.

3.  Structure des questions

On distingue : les questions ouvertes et les questions fermées. Les questions fermées peuvent être structurées ou non.

G.  Pré-test

C’est une phase qui consiste à simuler le questionnaire sur un échantillon de très petite taille. Elle permet d’évaluer le questionnaire et le comportement des interlocuteurs lors de l’administration.

H. Administrer le questionnaire

C’est la phase du contact avec les unités de l’échantillon. Selon la qualité de l’étude, le type d’individus à contacter et le contexte socio-politique, certaines formalités administratives peuvent être nécessaires. L’administration du questionnaire doit être faite par des personnes qui présentent une certaine qualification (niveau d’alphabétisation). Cette phase nécessite un grand effort de supervision.

Vous êtes sur le blog ''le statisticien''.

 

Publicité
Publicité
le statisticien
Publicité
Archives
Publicité