Projets M1 - CHPS

Planning 2025 - 2026

Les projets sont divisés en deux périodes. Les dates importantes sont les suivantes.

1er semestre:
- 6 octobre à 14h: Réunion de présentation des projets
- 7 octobre à 14h: Date de début pour la constitution des groupes et choix des sujets
- 10 octobre 23h59: Date limite pour la constitution des groupes et choix des sujets
- 30 octobre 23h59: Date limite pour le rendu de l’état de l’art et la mise en place de vos dépôts logiciels
- 19 décembre 23h59: Date limite pour le rendu des rapports première période
- 23 janvier à 10h00: Soutenance première période en amphithéâtre
2nd semestre:
- 2 mai à 23h59: Date limite pour le rendu des rapports seconde période
- 7 mai à 10h00: Soutenance seconde période en amphithéatre

Soutenances 1ère période 23 janvier

Assister aux soutenances de vos camarades est enrichissant, c’est pourquoi la présence est obligatoire à l’ensemble des soutenances.

Vous disposez de vingt minutes de présentation et quinze minutes de questions. Vous devez présenter en français mais vous pouvez avoir vos supports (slides) en anglais si vous le souhaitez.

 10h00-10h45 Groupe 1
 10h45-11h30 Groupe 2
 11h30-12h15 Groupe 6

 14h00-14h45 Groupe 3
 14h45-15h30 Groupe 4
 15h30-16h15 Groupe 7

Soutenances 2nde période 7 mai

Assister aux soutenances de vos camarades est enrichissant, c’est pourquoi la présence est obligatoire à l’ensemble des soutenances.

Vous disposez de vingt minutes de présentation et quinze minutes de questions. Vous devez présenter en français mais vous pouvez avoir vos supports (slides) en anglais si vous le souhaitez.

Planning PROVISOIRE:

 10h00-10h45 Groupe 4
 10h45-11h30 Groupe 3
 11h30-12h15 Groupe 6

 14h00-14h45 Groupe 7
 14h45-15h30 Groupe 2
 15h30-16h15 Groupe 1

Organisation

Choix du groupe et du sujet

Il faut constituer des groupes de quatre personnes. Chaque groupe classera les sujets suivant par ordre de préférence.

Pour indiquer votre choix de groupe et de sujet, merci d’envoyer un mail à < hugo POINT bollore AROBASE uvsq POINT fr > hugo.bollore@uvsq.fr. Suivez scrupuleusement les instructions suivantes:

Sur le champ Objet, indiquez « [PPN] Choix du sujet »,
En CC du mail mettez les adresses email UVSQ de tous les membres du groupe,
Dans le corps du mail donnez les sujets par ordre de préférence,
Respectez l’heure d’envoi du mail.

Les sujets seront attribués en essayant de satisfaire vos choix. Si votre mail ne respecte pas les consignes ci-dessus (il manque des membres en CC, il n’y a pas tous les sujets, le mail est envoyé trop tôt, etc.), vous serez moins prioritaire sur le choix des sujets que les groupes ayant respecté les consignes.

Les attributions finales de projet vous seront communiquées rapidement.

Prise de contact avec l’encadrant

Une fois votre sujet final confirmé vous devez prendre contact avec l’encadrant. L’encadrant vous indiquera ce qu’il attend de vous dans le projet et quels sont les objectifs pour la première et deuxième période.

L’encadrant pourra vous aider par mail et vous devrez planifier plusieurs rendez-vous au cours de l’année. C’est votre responsabilité de prendre contact avec lui et de lui demander des rendez vous ou lui poser des questions quand vous avez besoin d’aide.

Travail

Chaque groupe doit obligatoirement mettre en place un dépôt github contenant les sources de vos travaux ainsi que tout script d’expérimentation.

Le travail peut être réparti mais vous devez tous participer au développement de votre projet. A ce titre, il n’est pas accepté qu’une personne n’ait aucune contribution sur le dépôt github.

Vous devrez impérativement renseigner vos noms et prénoms sur vos comptes github pour que l’on puisse évaluer les participations de chacun.

Celui-ci devra être publique et vous devrez transmettre le lien vers celui-ci à :

Votre encadrant
Monsieur Bolloré < hugo POINT bollore AROBASE uvsq POINT fr > hugo.bollore@uvsq.fr
Monsieur Oliveira < pablo POINT oliveira AROBASE uvsq POINT fr > pablo.oliveira@uvsq.fr

Vous devrez indiquer dans le champ objet « [PPN] Lien dépôt Groupe x» et dans le mail la liste des étudiants de votre groupe

Déroulement des projets

Plusieurs étapes seront obligatoires:

A la fin du premier mois vous devrez :
- Remettre un état de l’art sur votre sujet
  
  Celui-ci devra être envoyé à votre encadrant ainsi qu’au chargé de la matière (Il est conseillé d’échanger en amont avec votre encadrant pour éviter les hors sujets)
- Avoir mis en place votre dépôt github et transmis un lien vers celui-ci
A la fin de chaque mois vous devrez :
- Avoir un rendez-vous avec votre encadrant
- Fournir un résumé de vos activités depuis le mois précédent

Rapports et soutenances

À la fin de chaque période un rapport sera envoyé par mail en mettant en destinataires < hugo POINT bollore AROBASE uvsq POINT fr > hugo.bollore@uvsq.fr et à votre encadrant.

Chaque rapport doit faire environ 10 pages en police 11 simple interligne. Ceci sans compter les figures ou les pages blanches, soit environ 4000 mots.

Le plagiat est strictement interdit, nous vous invitons à prendre connaissance de la charte anti-plagiat.

Le code source produit durant le projet sera propre, indenté, commenté et documenté.

Il faudra aussi préparer une présentation de 20 minutes avec 15 minutes de questions. Les slides seront à envoyer à la fin de la soutenance aux mêmes destinataires que précédemment.

Sujets

1) Implémentation d’un réseau de neurones pour la reconnaissance de chiffres manuscrit

Encadrant: Aurélien Delval
E-Mail: < aurelien POINT delval AROBASE uvsq POINT fr > aurelien.delval@uvsq.fr

Un problème classique pour aborder le machine learning est la résolution du jeu de données MNIST. Il s’agit d’une base de données regroupant des images de chiffres manuscrits de petite taille (28x28) en noir et blanc.

Le but est d’entraîner un programme (dans notre cas un réseau de neurones) à classifier chaque image dans la bonne catégorie (un chiffre de 0 à 9). Ce réseau de neurones devra être implémenté de zéro en C ou C++, ce qui nécessitera de se familiariser avec la théorie dans un premier temps.

Le projet se déroulera de la manière suivante.

Premier semestre:

Recherches et familiarisation sur l’aspect théorique (structure d’un réseau de neurones, différentiation automatique, descente de gradient, …)
Implémentation d’un système de différentation automatique, d’un premier réseau de neurones, et d’un algorithme de descente de gradient
Test de l’ensemble sur le jeu de donnée MNIST

Second semestre:

Mesures de performances de la version séquentielle
Exploration, puis implémentation de pistes de parallélisation (parallélisation de mini-batches par exemple)
Mesures de performances et itérations sur la version parallèle
Si possible, amélioration du taux de précision (en jouant sur des critères comme le choix de la fonction d’activation et le dimensionnement du réseau)

En résumé, l’objectif du premier semestre sera de développer une version minimale, et celui du deuxième d’améliorer le temps d’entraînement et la précision.

2) Path tracing: méthodes de Monte Carlo pour la synthèse d’images

Encadrant: Aurélien Delval
E-Mail: < aurelien POINT delval AROBASE uvsq POINT fr > aurelien.delval@uvsq.fr

Les techniques de ray tracing pour la synthèse d’images en trois dimensions deviennent de plus en plus répandues. Leur principe est de simuler le trajet des photons (ou “rayons”) dans le but d’obtenir un rendu réaliste.

En particulier, l’objectif de ce sujet sera d’implémenter un renderer fonctionnant sur le principe du path tracing, une approche combinant le ray tracing “classique” avec les méthodes de Monte-Carlo (càd. utilisant des procédés aléatoires pour résoudre des problèmes déterministes). Cette approche consiste à choisir aléatoirement les rebonds des rayons quand ils rencontrent un obstacle. Elle a notamment l’avantage de converger vers la solution exacte de l’équation de rendu, qui décrit l’équilibre entre la lumière reçue et émise par une surface, permettant ainsi des rendus particulièrement fidèles. Le projet se déroulera de la manière suivante.

Premier semestre:

Recherches et familiarisation sur l’aspect théorique (principes de base du ray tracing et des méthodes de Monte Carlo, BRDF, …)
Implémentation d’un premier renderer se basant sur une approche de ray-casting simple (sans prendre en compte les rebonds des rayons)
Généralisation au path-tracing avec la prise en compte de la BRDF pour la génération de rebonds aléatoires
Premières expérimentations sur le rendu de scènes simples (variation du nombre d’échantillons par pixels, …)

Second semestre:

Mesures de performance sur l’implémentation séquentielle du premier semestre
Parallélisation de cette implémentation
Mesures de performances et itérations sur la version parallèle
Autres optimisations et améliorations algorithmiques (réutilisation des chemins déjà calculés, Metropolis light transport, …)

3) Méthodes ensemblistes pour la modélisation

Encadrants: Mathys JAM
E-Mail: < mathys POINT jam AROBASE uvsq POINT fr > mathys.jam@uvsq.fr

On dispose d’un jeu de données regroupant les exécutions d’un programme avec plusieurs configurations. On souhaite modéliser ce programme via des techniques d’IA afin de pouvoir plus facilement explorer l’espace des configurations. L’objectif de ce projet est d’implémenter en C ou C++ une technique ensembliste pour la régression, à partir de zéro. Plus spécifiquement, on s’intéressera aux méthodes de bagging et de boosting se basant sur les arbres de décisions.

Pour cela, les étudiants devront réaliser un travail bibliographique pour mieux comprendre le domaine des techniques ensemblistes et le fonctionnement des arbres de décisions, puis implémenter un ou plusieurs de ces algorithmes. Le projet se composera en deux phases :

Premier semestre

Implémentation d’un arbre de décision pour la régression, module de chargement de données
Implémentation des méthodes de bagging et de boosting se basant sur les arbres de décisions
Évaluation de précision et profilage de performance, cross-validation par technique des k-folds, impact des hyper-paramètres sur le modèle

Second semestre

Parallélisation de la construction des arbres, méthodes ensemblistes distribués
Mesures de performances et comparaisons des différentes versions. Mesure de l’impact des optimisations sur la précision finale du modèle.

Une attention particulière sera portée sur la qualité logicielle. Les données d’entraînement seront mises à disposition par l’encadrant pendant le premier semestre.

4) Simulateur 3D pour l’erosion de terrain

Encadrants: Mathys JAM
E-Mail: < mathys POINT jam AROBASE uvsq POINT fr > mathys.jam@uvsq.fr

Ce projet consiste à combiner une simulation d’érosion de terrain avec un pipeline de rendu 3D interactif et haute performance.

Les etudiants devront:

Implémenter un système de terrain 3D, supportant la génération procédurale ainsi que le chargement de données réelles (heightmaps).
Implémenter plusieurs algorithmes d’érosion (au minimum : Thermal Erosion et Hydraulic Erosion), avec possibilité d’extensions.
Implementer un moteur de rendu 3D permettant a l’utilisateur d’explorer librement le terrain en train d’etre simuler.

À noter: le rendu ne doit pas se limiter au terrain final. La simulation et le rendu doivent être simultanes et interactifs, de manière à permettre un contrôle utilisateur (exploration, paramétrage des modèles, accélération/ralentissement du temps).

Une attention particuliere sera porter sur le genie logiciel de l’implementation.

Premier semestre:

Génération/chargement et rendu d’un terrain 3D simple via OpenGL.
Gestion de la caméra et des interactions utilisateur (exploration libre).
Implémentation séquentielle d’un premier algorithme d’érosion (Thermal Erosion).
Systeme de validation et mesure de l’impact des timesteps sur la precision

Second semestre

Raffinement et optimisation du moteur de rendu 3D (LOD, culling, shaders plus efficaces).
Optimisation et parallelisation des algorithmes d’erosions
Visualisation comparatives (Heatmaps de l’erosion, champs de vecteur de l’erosion, etc.)

5) Solveur Parallèle de l’Équation de la Chaleur 2D/3D

Encadrants: Rodolphe THIENARD
E-Mail: < rodolphe POINT thienard AROBASE qarnot TIRET computing POINT com > rodolphe.thienard@qarnot-computing.com

Intro

Un solveur parallèle de l’équation de la chaleur permet de simuler la diffusion thermique en 2D/3D. Il intègre les méthodes de discrétisation spatiale (maillages structurés ou non) et temporelle (schémas explicites/implicites) avec des optimisations HPC (parallélisme mémoire partagée/distribuée, vectorisation). Le solveur qui implémente un schéma numérique de maillages structurés ou non, des conditions aux limites physiques (Dirichlet, Neumann, Robin), et des propriétés matérielles hétérogènes, sera initialement validé sur des maillages cartésiens avant d’être étendu à des géométries complexes. L’implémentation sera au choix entre Rust ou C.

Termes

Schéma explicite (ex: Euler progressif)
Schéma implicite (ex: Crank-Nicolson)
Maillages structurés, grille régulière (ex: NxNxN)
Maillages non structuré, grille irrégulière (ex: format CSR, BSR)

Condition limites physiques :

Dirichlet (temperature imposée)
Neumann (flux imposé)
Robin (convection)

matérielles hétérogènes (conductivité termique)

acier (50 W/mK)
eau (0.6089 w/mK)
air (0.026 W/mK)

Semestre 1

Analyse des solveurs existants : Dealii
Implémentation d’un solveur 2D/3D en Rust ou C
Validation des résultats
Implémentation d’une output en .vtk (paraview)
Mise en perspective des résultats avec une implémentation connue
Conclusion sur l’implémentation séquentielle

Semestre 2

Parallélisation du code implémenté
- implémentation en mémoire partagée (pthread / openMP / rayon)
- implémentation en mémoire distribué (mpi)
Critique des résultats obtenus; détection des bottlenecks;
Optimisation sur Cluster
Mise en perspective des résultats avec une implémentation connue
Conclusion de fin de projet

6) RULESH: Portage Rust de la proxy-app LULESH

Encadrant : Gabriel DOS SANTOS
E-mail : < gabriel POINT dos TIRET santos AROBASE uvsq POINT fr > gabriel.dos-santos@uvsq.fr(mail)

La proxy-app LULESH (Livermore Unstructured Lagrangian Explicit Shock Hydrodynamics) est developpée par le Lawrence Livermore National Laboratory (LLNL). LULESH illustre un code typique d’hydrodynamique, avec une discrétisation du domaine en éléments volumiques définis par un maillage. Basé sur un maillage hexahédrique non structuré, LULESH utilise des tableaux d’indirection pour définir les relations du maillage. Le cas test par défaut utilise un maillage cartésien régulier, mais uniquement pour une question de simplicité. Il est essentiel de conserver la gestion non structurée du maillage lors du portage en Rust, car elle est nécessaire pour simuler des géométries plus complexes.

Semestre 1

Étude de l’implémentation de référence LULESH ;
Implémentation séquentielle en Rust ;
Validation des résultats ;
Profilage de performance et identification des points chauds ;
Mise en place d’optimisations séquentielles et comparaison avec l’implémentation de référence.

Semestre 2

Parallélisation du code porté :
- En mémoire partagée avec rayon ;
- En mémoire distribuée avec lamellar.
Évalution de performance sur environnement parallèle et identification des points chauds ;
Optimisations parallèles et comparaison avec l’implémentation de référence ;
Conclusion générales sur le portage et l’utilisation du langage Rust dans un cadre HPC.

7) Modélisation et simulation distribuée du mouvement d’un banc de poissons

Encadrant : Soufian BEN AMOR
E-mail : < soufian POINT ben TIRET amor AROBASE uvsq POINT fr > soufian.ben-amor@uvsq.fr

Un problème classique pour aborder la modélisation de systèmes complexes et le calcul parallèle est la simulation du comportement collectif dans la nature. L’étude du mouvement d’un banc de poissons constitue un excellent cas d’application : il s’agit d’un système multi- agents où chaque individu suit des règles locales simples (évitement des collisions, alignement, cohésion) qui produisent un comportement collectif émergent.

Le but est de concevoir et de mettre en œuvre un simulateur distribué reproduisant le mouvement d’un banc de poissons, en s’appuyant sur un modèle d’agents autonomes interagis- sant en temps réel. La simulation devra être codée en C++ ou en Python, et exploitera les principes de modélisation multi-agents et de parallélisation pour garantir de bonnes performances lorsque le nombre de poissons simulés devient important.

Premier semestre :

Recherches et familiarisation avec les modèles de comportement collectif (règles de Reynolds, modèles de Boids, interactions locales, forces de cohésion et de répulsion, etc.)
Implémentation d’un premier simulateur séquentiel simple (mise à jour du mouvement des agents selon les trois règles de base : séparation, alignement, cohésion)
Visualisation 2D ou 3D du comportement du banc de poissons à l’aide d’une librairie graphique (OpenGL, Matplotlib, ou équivalent)
Tests et validation qualitative du modèle (comportement collectif émergent cohérent)

Second semestre :

Analyse des performances et identiﬁcation des goulots d’étranglement dans la version séquentielle
Exploration et implémentation d’approches de parallélisation (distribution des agents sur plusieurs threads ou nœuds, communication inter-processus avec MPI ou OpenMP, gestion des zones locales d’interaction)
Mesures comparatives des performances entre la version séquentielle et la version pa- rallèle (scalabilité, temps de calcul, réactivité du système)
Si possible, amélioration du réalisme de la simulation (ajout d’obstacles, de prédateurs, ou d’un environnement dynamique inﬂuençant le banc)

En résumé, l’objectif du premier semestre est de développer une version séquentielle fonctionnelle et visuellement cohérente du modèle, tandis que celui du second semestre est d’optimiser cette simulation par des approches de parallélisation et d’améliorer la ﬁdélité du comportement collectif.