Bioinformatique : séquence d'ADN et de protéines

lbrmc2201  2019-2020  Louvain-la-Neuve

Bioinformatique : séquence d'ADN et de protéines
Note du 29 juin 2020
Sans connaitre encore le temps que dureront les mesures de distances sociales liées à la pandémie de Covid-19, et quels que soient les changements qui ont dû être opérés dans l’évaluation de la session de juin 2020 par rapport à ce que prévoit la présente fiche descriptive, de nouvelles modalités d’évaluation des unités d’enseignement peuvent encore être adoptées par l’enseignant ; des précisions sur ces modalités ont été -ou seront-communiquées par les enseignant·es aux étudiant·es dans les plus brefs délais.
4 crédits
30.0 h + 15.0 h
Q1
Enseignants
Ghislain Michel (coordinateur); Mahillon Jacques;
Langue
d'enseignement
Français
Préalables
Notions de base en biochimie et en biologie moléculaire.
Thèmes abordés
La bio-informatique désigne l'ensemble des concepts et des techniques nécessaires au traitement de l'information biologique et à son interprétation. Ce cours introductif décrit :
- les bases de données où sont conservées les séquences nucléotidiques et polypeptidiques
- les concepts et les outils informatiques qui sont nécessaires à l'analyse des séquences de l'ADN ou des protéines encodées (identification des régions codantes, recherche de ressemblances ou de motifs conservés, relations évolutives)
- les concepts et les outils informatiques utilisés pour la prédiction de structures secondaires de l'ARN et la détection des traverses membranaires des protéines
- certains outils statistiques développés pour l'interprétation des résultats
Acquis
d'apprentissage

A la fin de cette unité d’enseignement, l’étudiant est capable de :

1 a. Contribution de l'activité au référentiel AA (AA du programme)
Cohérence des AA cours en regard de ceux du programme
1.1, 1.2, 1.3
3.1, 3.2, 3.4, 3.5, 3.6
b. Formulation spécifique pour cette activité des AA du programme
A la fin de cette activité, l'étudiant est capable d'identifier les outils informatiques (logiciels, base de données) les plus appropriés pour résoudre un problème scientifique, lié à l'analyse des séquences d'ADN ou de protéine, c'est-à-dire :
- Expliquer les concepts théoriques sous-jacents aux outils bio-informatiques
-Consulter les bases de données, expliquer comment l'information y est organisée, et identifier leurs avantages et inconvénients respectifs
- Confirmer ou réfuter les résultats d'analyse et les prédictions disponibles ; le cas échéant, proposer des analyses informatiques plus performantes ou rigoureuses
-Élaborer une méthodologie d'analyse complète à partir d'une séquence inconnue
 

La contribution de cette UE au développement et à la maîtrise des compétences et acquis du (des) programme(s) est accessible à la fin de cette fiche, dans la partie « Programmes/formations proposant cette unité d’enseignement (UE) ».
Contenu
1.     Introduction et contenu du cours
2.     Les bases de données ciblées sur les séquences nucléiques et polypeptidiques, les motifs conservés et les familles de protéines, les organismes
3.     Comparaison, alignement global et local de séquences par la technique de programmation dynamique, matrices de score
4.     Recherche de séquences similaires dans les bases de données par la technique de la table de hachage
5.     Alignement multiple global et local (matrices de score à position spécifique, modèle caché de Markov)
6.     Construction d'arbres phylogénétiques (distance et approche cladistique)
7.     Analyse  transcriptomique à haut début: données RNA seq
8.     Analyse métagénomique
Méthodes d'enseignement
Les compétences visées par le cours seront développées à l'aide d'exposés magistraux, incluant des exemples concrets d'analyse de séquence, et à l'aide d'exercices encadrés à réaliser individuellement ou en groupe, en salle informatique. 
Modes d'évaluation
des acquis des étudiants
Un examen à livre ouvert sur 12 points permet d'évaluer les compétences théoriques développées au cours, c-à-d :
 -la compréhension des concepts visés par le cours
- l'identification et la justification des outils informatiques (logiciels, bases de données) les plus appropriés
- l'interprétation statistique des résultats ou des prédictions obtenus
Les compétences pratiques est évaluée sur 8 points au cours du quadrimestre , à travers des exercices  à résoudre sur PC , individuellement ou en groupe de 2-3 étudiant.e.s. 
Autres infos
Ce cours peut être donné en anglais.
Ressources
en ligne
Moodle
Bibliographie
Des copies papier des diaporamas et le manuel pour les exercices sont disponibles sur Moodle.
Le cours ne fait appel à aucun support particulier qui serait payant et jugé obligatoire. Les ouvrages Bioinformatics de Mount (CSHL press) et Bioinformatics and functional genomics de Pevsner sont conseillés pour un apprentissage plus approfondi
Support de cours
  • Bioinformatics sequence and genome analysis D. Mount
  • Bioinformatics and functional genomics by Pevsner
Faculté ou entité
en charge
AGRO


Programmes / formations proposant cette unité d'enseignement (UE)

Intitulé du programme
Sigle
Crédits
Prérequis
Acquis
d'apprentissage
Master [120] : bioingénieur en chimie et bioindustries

Master [120] en statistique, orientation biostatistiques

Master [120] en biochimie et biologie moléculaire et cellulaire

Master [120] : bioingénieur en sciences agronomiques

Master [60] en sciences biologiques