Bioinformatique : séquence d'ADN et de protéines

lbrmc2201  2020-2021  Louvain-la-Neuve

Bioinformatique : séquence d'ADN et de protéines
En raison de la crise du COVID-19, les informations ci-dessous sont susceptibles d’être modifiées, notamment celles qui concernent le mode d’enseignement (en présentiel, en distanciel ou sous un format comodal ou hybride).
4 crédits
30.0 h + 15.0 h
Q1
Enseignants
Ghislain Michel;
Langue
d'enseignement
Français
Thèmes abordés
La bio-informatique désigne l'ensemble des concepts et des techniques nécessaires au traitement de l'information biologique et à son interprétation. Ce cours introductif décrit :
- les bases de données où sont conservées les séquences nucléotidiques et polypeptidiques
- les concepts et les outils informatiques qui sont nécessaires à l'analyse des séquences de l'ADN ou des protéines encodées (identification des régions codantes, recherche de ressemblances ou de motifs conservés, relations évolutives)
- les concepts et les outils informatiques utilisés pour la prédiction de structures secondaires de l'ARN et la détection des traverses membranaires des protéines
- certains outils statistiques développés pour l'interprétation des résultats
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 a. Contribution de l'activité au référentiel AA (AA du programme)
Cohérence des AA cours en regard de ceux du programme
1.1, 1.2, 1.3
3.1, 3.2, 3.4, 3.5, 3.6
b. Formulation spécifique pour cette activité des AA du programme
A la fin de cette activité, l'étudiant est capable d'identifier les outils informatiques (logiciels, base de données) les plus appropriés pour résoudre un problème scientifique, lié à l'analyse des séquences d'ADN ou de protéine, c'est-à-dire :
- Expliquer les concepts théoriques sous-jacents aux outils bio-informatiques
-Consulter les bases de données, expliquer comment l'information y est organisée, et identifier leurs avantages et inconvénients respectifs
- Confirmer ou réfuter les résultats d'analyse et les prédictions disponibles ; le cas échéant, proposer des analyses informatiques plus performantes ou rigoureuses
-Élaborer une méthodologie d'analyse complète à partir d'une séquence inconnue
 
Contenu
1.     Introduction et contenu du cours
2.     Les bases de données ciblées sur les séquences nucléiques et polypeptidiques, les motifs conservés et les familles de protéines, les organismes
3.     Comparaison, alignement global et local de séquences par la technique de programmation dynamique, matrices de score
4.     Recherche de séquences similaires dans les bases de données par la technique de la table de hachage
5.     Alignement multiple global et local (matrices de score à position spécifique, modèle caché de Markov)
6.     Construction d'arbres phylogénétiques (distance et approche cladistique)
7.     Analyse  transcriptomique à haut début: données RNA seq
8.     Analyse métagénomique
Méthodes d'enseignement

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Les compétences visées par le cours seront développées à l'aide d'exposés magistraux, incluant des exemples concrets d'analyse de séquence, et à l'aide d'exercices encadrés à réaliser individuellement ou en groupe, en salle informatique. 
Modes d'évaluation
des acquis des étudiants

En raison de la crise du COVID-19, les informations de cette rubrique sont particulièrement susceptibles d’être modifiées.

Un examen à livre ouvert sur 12 points permet d'évaluer les compétences théoriques développées au cours, c-à-d :
 -la compréhension des concepts visés par le cours
- l'identification et la justification des outils informatiques (logiciels, bases de données) les plus appropriés
- l'interprétation statistique des résultats ou des prédictions obtenus
Les compétences pratiques est évaluée sur 8 points au cours du quadrimestre , à travers des exercices  à résoudre sur PC , individuellement ou en groupe de 2-3 étudiant.e.s. 
Autres infos
Ce cours peut être donné en anglais.
Ressources
en ligne
Moodle
Bibliographie
Des copies papier des diaporamas et le manuel pour les exercices sont disponibles sur Moodle.
Le cours ne fait appel à aucun support particulier qui serait payant et jugé obligatoire. Les ouvrages Bioinformatics de Mount (CSHL press) et Bioinformatics and functional genomics de Pevsner sont conseillés pour un apprentissage plus approfondi
Support de cours
  • Bioinformatics sequence and genome analysis D. Mount
  • Bioinformatics and functional genomics by Pevsner
Faculté ou entité
en charge
AGRO
Force majeure
Modes d'évaluation
des acquis des étudiants
Examen écrit de 3 heures - Moodle


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [60] en sciences biologiques

Master [120] en biochimie et biologie moléculaire et cellulaire

Master [120] : bioingénieur en chimie et bioindustries

Master [120] en statistique, orientation biostatistiques