En pratique

  • Cette unité d'enseignement (UE) articule 1 activité d'apprentissage :
    • Data Analytics - Data Mining
  • En 2025-2026, elle s'organise au premier quadrimestre et couvre 4 crédits (ECTS).
  • L'enseignement est principalement centralisé dans le campus : Département Informatique
  • Cette UE est remédiable d'une session à l'autre
  • Modalités d'enseignement
    • Auditoire
    • Sous-groupe
    • Travaux pratiques dans un local équipé spécifiquement
    • en autonomie

Activité d’apprentissage

Les finalités de l'UE

Cette unité d’enseignement initie les étudiants aux méthodes modernes d’analyse et d’exploitation des données, essentielles dans les métiers de l’IA et de la science des données. Elle offre une compréhension intégrée du cycle de vie des données et des outils permettant de transformer des données brutes en informations utiles pour la décision. Sur le plan professionnalisant, elle familiarise les étudiants avec les environnements de travail actuels (Python, bibliothèques spécialisées, audit de données) et développe des compétences métier clés : préparation et qualité des données, modélisation, segmentation non supervisée et détection d’anomalies. Elle favorise enfin l’autonomie et l’esprit critique face aux résultats analytiques.

Les contenus de l'UE

Cette unité d’enseignement propose une introduction approfondie aux méthodes et pratiques du data mining, en alternant systématiquement entre une partie théorique et des laboratoires pratiques. L’articulation entre ces deux volets est centrale : les apports conceptuels sont immédiatement mis en œuvre par des manipulations de données réelles, ce qui permet aux étudiants de comprendre non seulement le « comment », mais aussi le « pourquoi » des démarches utilisées.

La partie théorique installe d’abord les bases du cycle de vie des données, depuis la collecte jusqu’à l’interprétation, en insistant sur la question de la qualité : cohérence, valeurs manquantes, doublons, biais ou anomalies. Les étudiants découvrent ensuite les méthodes de feature engineering, c’est-à-dire la transformation et la création de variables permettant d’améliorer la pertinence des analyses et la performance des modèles. Un autre axe important concerne la réduction de dimension, qui introduit des techniques comme l’ACP ou le t-SNE afin de simplifier l’espace des données, faciliter la visualisation et limiter la redondance.

Un second bloc est consacré à l’apprentissage non supervisé, en particulier aux techniques de clustering et aux métriques qui permettent d’évaluer la qualité des regroupements. Ces notions ouvrent la voie à une exploration plus autonome des données et à la détection de structures latentes. L’unité s’élargit ensuite à des thématiques appliquées, telles que le text mining, l’analyse de graphes ou la détection d’anomalies, qui rapprochent directement les étudiants de cas rencontrés dans les secteurs professionnels (analyse de réseaux, cybersécurité, suivi qualité, veille d’opinion, etc.).

Les laboratoires pratiques viennent systématiquement consolider ces apprentissages : manipulation de jeux de données variés, mise en œuvre d’outils Python adaptés, interprétation des résultats et communication des conclusions. L’ensemble favorise l’acquisition de compétences techniques, mais aussi le développement d’une posture critique et autonome, essentielle pour tout futur praticien de l’intelligence artificielle.

Les acquis d'apprentissage visés par l'UE

Au terme de cette UE, l’étudiant·e devrait être capable:

  • D'identifier et d’évaluer la qualité d’un jeu de données (cohérence, complétude, valeurs manquantes, anomalies, biais).

  • De préparer et transformer les données en mobilisant des techniques de nettoyage et de feature engineering adaptées au problème posé.

  • D’appliquer des méthodes de réduction de dimension et d’en interpréter les résultats pour simplifier un espace de variables et en faciliter la visualisation.

  • De mettre en œuvre des techniques de clustering pour explorer des regroupements non supervisés et évaluer la pertinence de ces regroupements à l’aide de métriques internes et/ou externes.

  • D’analyser et interpréter des résultats issus de méthodes appliquées (text mining, analyse de graphes, détection d’anomalies), en les reliant à des cas concrets.

  • De manipuler efficacement des environnements professionnels (notebooks Python, bibliothèques spécialisées) pour produire des analyses reproductibles et documentées.

  • De rédiger et présenter un rapport structuré mettant en évidence la démarche suivie, les résultats obtenus et les limites identifiées, dans un langage clair et adapté à un public cible.

  • D'adopter une posture réflexive et critique vis-à-vis des résultats analytiques, en étant capable de justifier les choix méthodologiques et de proposer des améliorations.

Les méthodes d'enseignement-apprentissage

Cette unité d’enseignement alterne des apports théoriques et des travaux pratiques en laboratoire, afin de lier compréhension des concepts et mise en application concrète. Les cours introduisent progressivement les méthodes et outils du data mining, tandis que les laboratoires permettent aux étudiant·es d’expérimenter directement sur des jeux de données réels avec Python. Cette alternance favorise une progression guidée puis autonome, encourage le travail collaboratif et développe l’esprit critique face aux choix méthodologiques et aux résultats produits.

Engagement attendu de la part de l'étudiant.e

Dans cette UE, une participation active est essentielle. Les étudiant·es sont invité·es à revoir régulièrement la matière et à reprendre les exercices en autonomie pour consolider leurs acquis. Il est conseillé d’appliquer rapidement les méthodes vues en cours dans de petits projets ou travaux personnels, afin de mieux s’approprier les concepts et développer des réflexes pratiques utiles pour l’évaluation.

Examen Data Mining

Cette épreuve présente des modalités similaires pour toutes les sessions. Elle est organisée durant la session. Il s'agit d'un examen. Cette épreuve est individuelle. Concrètement, l'épreuve repose sur une formulation orale, une réalisation par mise en pratique. Elle se déroule à cours ouvert. La correction de cette épreuve est assurée par validation d'un.e enseignant.e.

Règles de l’UE

Quels sont les supports et matériels de cours indispensables ?

Supports et matériels de cours

Pour suivre cette unité d’enseignement, chaque étudiant·e doit disposer d’un ordinateur portable personnel suffisamment performant pour exécuter des notebooks Python et manipuler des jeux de données de taille moyenne. L’installation préalable de logiciels libres tels qu’Anaconda/Python, Jupyter Notebook et des bibliothèques standards (pandas, scikit-learn, seaborn, matplotlib, etc.) est obligatoire. Aucun ouvrage payant n’est requis : toutes les ressources théoriques seront fournies via HELMo Learn ou par l’enseignant·e.

Comment la note globale de l’UE est-elle déterminée ?

Explication de la pondération des différentes épreuves

L’évaluation de cette UE repose sur deux épreuves complémentaires :

  • un travail écrit à remettre (40 %),

  • une présentation orale du projet (60 %).

Pour réussir l’UE, l’étudiant·e doit obtenir au moins 10/20 à chacune des deux épreuves. Le travail écrit constitue ainsi la base de l’évaluation, mais la présentation orale est indispensable pour valider les acquis et démontrer la maîtrise du projet.

Quelles sont les informations administratives de cette UE ?