Intro
Profil
Projets
Recherche
Contact
Retour aux projets
Machine Learning / Bio-informatiqueAcadémique

Protein Structure Prediction (LSTM)

Prédiction de la structure secondaire des protéines via des architectures Deep Learning (LSTM & MLP).

Aperçu non disponible

Stack

PythonPyTorchLSTMDeep LearningBio-informatique

Profil

Rôle

AI Researcher & Developer

Année

2024-2025

Le Défi

Le défi majeur résidait dans l'entraînement optimal d'un réseau récurrent (LSTM) sur des séquences biologiques, et l'ajustement minutieux des hyperparamètres (dropout, weight decay, dimensions de plongement) pour éviter le surapprentissage tout en surpassant le modèle de référence.

La Solution

Abandon de l'encodage One-Hot classique au profit d'une couche d'Embedding apprenant la similarité des acides aminés. Le cœur de l'architecture est composé de plusieurs couches LSTM bidirectionnelles pour capter le contexte avant/après de chaque résidu chimique, sécurisées par du Dropout (0.5) limitant le surapprentissage.

Fonctionnalités Clés

Encodage de séquences protéiques (Embeddings)
Modélisation récurrente avec LSTM multicouches
Comparaison de performances avec approches MLP standard

Compétences Développées

Deep Learning sur séquences avec PyTorchArchitectures LSTM / Réseaux récurrentsRégularisation de modèles complexesApplication de l'IA à la Bio-informatique

Résultats

"Performances nettement améliorées par rapport à un MLP classique avec fenêtre glissante, prouvant la capacité du LSTM à extraire le sens contextuel des chaînes protéiques complexes."