Professeur responsable

Belkacem Chikhaoui

Préalable

INF 1220

Objectifs

Contenu

Le cours est organisé en cinq modules, qui traitent de :

1. Définition des données massives : volume, variété, vélocité. Les différentes méthodes de traitement des données massives, traitement par lots (batch processing), traitement en continu (stream processing).

2. Principe de Map Reduce. Représentation de données dans HADOOP : le système HDFS, exemples d'applications.

3. Ensembles de données distribués résilients (RDD : resilient distributed datasets) : créer et utiliser des RDD, transformations sur des RDD. SPARK SQL, SPARK Graph X, SPARK MLIB : exemples d'applications.

4. Introduction aux données non structurées. Stockage des données non structurées : MongoDB. Requêtes sur des données non structurées.

5. Stockage et traitement des données en infonuagique (exemple de Google Cloud). Requêtes sur des données stockées en infonuagique : introduction à Big Query. Exemples d'application sur Google Cloud.

Matériel didactique

Le matériel didactique est accessible sur le site Web du cours.

Matériel expédié

Renseignements technologiques

Consultez l'information sur le matériel informatique requis.

Encadrement

L'encadrement est individualisé et assuré par le professeur responsable du cours ou par une personne tutrice. Les communications se font par téléphone ou par courriel.

Évaluation

L'évaluation repose sur cinq travaux en ligne (10 %, 10 %, 15 %, 15 % et 10 %) et un projet final (40 %).

Échelle de conversion

NotationValeur numériqueValeur en pourcentage
A+4,396 à 100 %
A492 à 95 %
A-3,788 à 91 %
B+3,384 à 87 %
B380 à 83 %
B-2,776 à 79 %
C+2,372 à 75 %
C268 à 71 %
C-1,764 à 67 %
D+1,360 à 63 %
D150 à 59 %
E00 à 49 %

* Échelle de conversion actuellement en vigueur pour ce cours.

Liste des programmes dont ce cours fait partie