Professeure responsable

Neila Mezghani

Objectifs

Décrire différentes techniques d'analyse de données. Sélectionner et appliquer efficacement les techniques d'analyse en fonction du contexte d'utilisation (description, clustering, régression, etc.) dans le but de faire émerger les connaissances et les informations significatives que peut contenir un ensemble de données. Participer à un projet de forage de données allant de la définition des variables à l'interprétation des résultats d'analyse.

Contenu

Bases du forage de données. Exploration et préparation des données. Analyse en composantes principales. Regroupement (clustering). Arbres de décision. Modèles de régression.

Matériel didactique

Le matériel didactique est accessible sur le site Web du cours.

Liste des documents expédiés

Renseignements technologiques

Le cours nécessite un accès à Internet, un logiciel de lecture de fichier PDF tel que Adobe Reader 9.0 ou + et un traitement de texte tel que Microsoft Word 1997-2003.

La personne qui s'inscrit au cours devra se procurer le logiciel Matlab pour réaliser les activités du cours. Pour obtenir des détails sur les versions du logiciel qui peuvent être utilisées, consultez la section sur Matlab dans la présentation du cours.

La configuration minimale d'un ordinateur personnel pour suivre le cours est la suivante :

Encadrement

L'encadrement est individualisé et assuré par une personne chargée d'encadrement. Les communications se font principalement par courriel.

Évaluation

L'évaluation repose sur cinq travaux notés (20 % chacun).

Particularités d'inscription

Des connaissances de base en statistiques et en programmation informatique sont nécessaires pour suivre ce cours. Si on ne possède pas ces connaissances, il est recommandé de suivre les cours SCI 1018 Statistiques appliquées aux sciences ainsi que INF 1220 Introduction à Java.