Data mining

 

Objectif

L'objectif de ce cours est de présenter les méthodes statistiques multidimensionnelles couramment utilisées dans l'exploration et l'exploitation de bases de données. De part leur taille, leur analyse nécessite un traitement statistique rigoureux qui va au-delà des simples statistiques de base. Ces méthodes sont utilisées dans de très nombreux secteurs, que l'on songe au secteur bancaire, au secteur des assurances ou au secteur hospitalier notamment.

Ce cours a une orientation pratique forte. Il s'agit de fournir aux étudiants un « guide de bonnes pratiques » leur permettant d'être opérationnel et autonome. Pour chaque méthode, nous procèderons à un bref exposé théorique avant de passer à la mise en pratique sur données réelles à l'aide des logiciels R et/ou SAS.

Plan

  • Introduction
  • L'Analyse en Composantes Principales (ACP)
  • L'Analyse Factorielle des Correspondances (AFC)
  • L'Analyse Factorielle des Correspondances Multiples (AFCM)
  • L'Analyse factorielle discriminante descriptive (AFD)
  • Méthodes de classification (Analyse Typologique et Classification Hiérarchique)

Bibliographie

  • Bourroche et Saporta. L'Analyse de données, Que sais-je? n°1854, PUF
  • Bry. Analyses factorielles simples, ECONOMICA
  • François et Toulemonde. Pratique de la Classification. Première partie : Classification automatique. Institut de statistique. Université de Paris
  • Giannelloni et Vernette. Etudes de marché, VUIBERT (Gestion)
  • Saporta. Probabilités, Analyse des données et Statistique, Editions Technip
  • Tenenhaus. Méthodes statistiques en gestion, DUNOD

Enseignements (suite) - Débouchés - Conseil statistique - Stages - Recherche - Intervenants - Témoignages