Bioinformatics : DNA and protein sequence analysis

lbrmc2201  2023-2024  Louvain-la-Neuve

Bioinformatics : DNA and protein sequence analysis
4.00 crédits
30.0 h + 15.0 h
Q1
Enseignants
Ghislain Michel;
Préalables
Notions de base en biochimie et en biologie moléculaire.
Thèmes abordés
La bio-informatique désigne l'ensemble des concepts et des techniques nécessaires au traitement de l'information biologique et à son interprétation. Ce cours introductif décrit :
- les bases de données où sont conservées les séquences nucléotidiques et polypeptidiques
- les concepts et les outils informatiques qui sont nécessaires à l'analyse des séquences de l'ADN ou des protéines encodées (identification des régions codantes, recherche de ressemblances ou de motifs conservés, relations évolutives)
- les concepts et les outils informatiques utilisés pour la prédiction de structures secondaires de l'ARN et la détection des traverses membranaires des protéines
- certains outils statistiques développés pour l'interprétation des résultats
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 a. Contribution de l'activité au référentiel AA (AA du programme)
Cohérence des AA cours en regard de ceux du programme
1.1, 1.2, 1.3
3.1, 3.2, 3.4, 3.5, 3.6
b. Formulation spécifique pour cette activité des AA du programme
A la fin de cette activité, l'étudiant est capable d'identifier les outils informatiques (logiciels, base de données) les plus appropriés pour résoudre un problème scientifique, lié à l'analyse des séquences d'ADN ou de protéine, c'est-à-dire :
- Expliquer les concepts théoriques sous-jacents aux outils bio-informatiques
-Consulter les bases de données, expliquer comment l'information y est organisée, et identifier leurs avantages et inconvénients respectifs
- Confirmer ou réfuter les résultats d'analyse et les prédictions disponibles ; le cas échéant, proposer des analyses informatiques plus performantes ou rigoureuses
-Élaborer une méthodologie d'analyse complète à partir d'une séquence inconnue
 
Contenu
1.     Introduction et contenu du cours
2.     Les bases de données ciblées sur les séquences nucléiques et polypeptidiques, les motifs conservés et les familles de protéines, les organismes
3.     Comparaison, alignement global et local de séquences par la technique de programmation dynamique, matrices de score
4.     Recherche de séquences similaires dans les bases de données par la technique de la table de hachage
5.     Alignement multiple global et local (matrices de score à position spécifique, modèle caché de Markov)
6.     Construction d'arbres phylogénétiques (distance et approche cladistique)
7.     Analyse  transcriptomique à haut débit: données RNA seq
Méthodes d'enseignement
Les compétences visées par le cours seront développées à l'aide d'exposés magistraux, incluant des exemples concrets d'analyse de séquence, et à l'aide d'exercices encadrés à réaliser individuellement ou en groupe, en salle informatique. 
Modes d'évaluation
des acquis des étudiants
Un examen écrit à livre ouvert sur 14 points permet d'évaluer les compétences théoriques développées au cours, c-à-d :
 -la compréhension des concepts visés par le cours
- l'identification et la justification des outils informatiques (logiciels, bases de données) les plus appropriés
- l'interprétation statistique des résultats ou des prédictions obtenus
Les compétences pratiques sont évaluées sur 6 points au cours du quadrimestre , à travers des exercices  à résoudre sur PC , individuellement ou en groupe de 2-3 étudiant.e.s.
La note finale sur 20 points est la somme arithmétique des notes de l'examen écrit (sur 14) et des exercices pratiques (sur 6)
Les énoncés des questions ou des exercices sont en anglais. Les étudiant.e.s ont le choix entre l'anglais et le français pour les réponses.
Autres infos
Ce cours est donné en anglais. 
Ressources
en ligne
Moodle
Bibliographie
Des copies papier des diaporamas et le manuel pour les exercices sont disponibles sur Moodle.
Le cours ne fait appel à aucun support particulier qui serait payant et jugé obligatoire. Les ouvrages Bioinformatics de Mount (CSHL press) et Bioinformatics and functional genomics de Pevsner sont conseillés pour un apprentissage plus approfondi
Support de cours
  • Bioinformatics sequence and genome analysis D. Mount
  • Bioinformatics and functional genomics by Pevsner
Faculté ou entité
en charge
AGRO


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] en biochimie et biologie moléculaire et cellulaire

Master [120] en statistique, orientation biostatistiques

Master [60] en sciences biologiques

Master [120] : bioingénieur en chimie et bioindustries