<- Archives UCL - Programme d'études ->



Analyse des données biologiques [ LBOE2112 ]


5.0 crédits ECTS  24.0 h + 36.0 h   1q 

Enseignant(s) Le Boulengé Éric ;
Langue
d'enseignement:
Français
Lieu de l'activité Louvain-la-Neuve
Ressources
en ligne

Le cours dispose d'un site sur les plateformes iCampus (UCL) et webCampus (FUNDP). Adresses internet :
http://www.icampus.ucl.ac.be/claroline/course/index.php?cid=BIOL3103
et
http://webcampus.fundp.ac.be/claroline/course/index.php?cid=SBOEM112
Sur ces sites, on trouvera l'adresse des enseignants (titulaires et assistants), la description du cours, le calendrier
des activités (page Agenda), une page d'annonces (à consulter régulièrement), les documents utiles au cours
(transparents, exemples et exercices, une liste de références bibliographiques et des liens vers des sites internet
utiles), un forum permettant de soumettre des questions et recevoir des réponses et enfin, une liste des inscrits au
cours. Chaque étudiant est invité à s'inscrire !
Les documents peuvent être téléchargés à partir de ces sites.
Les travaux pratiques de ce cours nécessitent un usage intensif de logiciels spécialisés pour l'analyse statistique.
Les logiciels utilisés sont d'une part JMP 9 et SAS (version 9.2) de l'Institut SAS, d'autre part le langage R,
enfin le tableur MS Excel. Ces logiciels sont installés et disponibles pour les étudiants du cours sur les
Version du 20/09/2011 É. Le Boulengé & É. Depiereux Maîtrise BOE, UCL & FUNDP 2
ordinateurs des salles informatiques didactiques où se dérouleront les séances de travaux pratiques (à l'UCL la
salle FISHER, Place Croix du Sud 3, LLN ; aux FUNDP : au Pool Informatique).
Les logiciels Microsoft Office (dont fait partie Excel) et SAS/JMP sont payants, l'Académie Louvain a
cependant négocié avec les firmes concernées des tarifs extrêmement avantageux pour ses étudiants et son
personnel. Les modalités pour les acquérir, pour ceux qui le souhaitent, seront précisées lors des travaux
pratiques. La procédure pour installer le logiciel (gratuit) R sera expliquée aux travaux pratiques.

Préalables

Le cours repose sur des bases supposées acquises par les étudiants plus tôt dans leurs études: calcul des
probabilités, bases de l'inférence statistique, principes et pratique des méthodes classiques pour des données
continues (régression, analyse de la variance) et discrètes (tests d'ajustement, tables de contingence), utilisation
d'un logiciel pour la mise en oeuvre de ces analyses dans des situations expérimentales classiques.

Thèmes abordés

Tenant compte des besoins le plus fréquemment rencontrés et du volume horaire disponible, le cahier des
charges prévoit un module de modélisation linéaire et un module d'analyse multidimensionnelle.
Vu son insertion dans le programme BOE, le cours puisera ses exemples surtout dans le domaine écologique.

Acquis
d'apprentissage

L'objectif est qu'au terme de ce cours, les étudiants :
' Aient intégré la nécessité d'une démarche de planification préalable à toute expérimentation.
' Aient mis en pratique, dans le cadre d'une expérience scientifique personnelle, les principaux principes
de cette démarche.
' Soient capables de rechercher, choisir et appliquer en connaissance de cause les méthodes les mieux
adaptées pour la modélisation et l'analyse des données biologiques dans leur domaine.
' Aient acquis une autonomie de base pour la mise sur pied d'une expérience scientifique, la gestion des
données qu'elle engendre, leur analyse à l'aide d'un logiciel statistique et l'interprétation critique des
résultats.
' Aient montré leur capacité à rédiger le rapport d'une expérience scientifique (à réaliser seul ou en
groupes de deux ou trois), reprenant l'ensemble des étapes ci-dessus.

Méthodes d'enseignement

Les étudiants veilleront à choisir assez tôt (octobre) le thème du travail et le feront approuver par l'un des
titulaires avant d'en entamer la réalisation.
Le canevas du travail (cadre scientifique, question, structure de l'expérience et des données, méthodologie
d'analyse pressentie) sera déposé sur une des plateformes du cours (iCampus, webCampus) au plus tard le
premier lundi suivant le 15 février. Sauf dérogation à justifier par écrit (courriel aux titulaires) pour le 15 janvier,
le non respect de cette date limite entraîne l'obligation de présenter le travail lors de la session de septembre. Ce
canevas sera présenté dans le format du rapport final et comprendra : titre, cadre scientifique, questions posées
(hypothèses), table des matières, structure de l'expérience et des données, méthodologie d'analyse pressentie
(ceci pourra évoluer en cours de travail) et, le cas échéant, la composition du groupe.
Ce travail fera l'objet d'un rapport de 5 pages (étudiant seul) ou 7 pages (groupe de 2 ou 3 étudiants) maximum,
imprimé en deux exemplaires et remis aux titulaires lors de l'examen.
Par ailleurs l'examen consiste en une présentation orale du travail, avec pour support un diaporama de 8 écrans
(étudiant seul ; durée maximale : 15 minutes) ou 10 écrans (groupe ; durée maximale : 20 minutes) maximum,
en format PDF.
Recommandations pour la rédaction des rapports et la confection du support de présentation orale : Ils devraient
comprendre les éléments suivants, qui font partie de leur évaluation : Situation du travail dans son cadre
scientifique ; question(s) posée(s), éventuelles hypothèses à éprouver ; structure de l'expérience et des (fichiers
de) données ; méthodologie d'analyse choisie et argumentation de ce choix ; résultats de l'analyse, en
privilégiant les illustrations pertinentes ; interprétation, critique et discussion de ces résultats ; références
bibliographiques s'il y a lieu.

 

Contenu

Module 1 : Modélisation statistique linéaire
Expériences factorielles : Réponses, facteurs, structure d'une expérience, combinaisons de facteurs, approche
factorielle ou d'observation, principes de planification expérimentale. Rappel des modèles linéaires classiques :
Facteurs quantitatifs, qualitatifs, choix fixe ou aléatoire des modalités, matrice d'expérience, paramètres.
Modèles linéaires mixtes. Modèles linéaires généralisés. Questions particulières : Pourquoi répéter des essais ?
Comment traiter de « mauvaises » données ?
Module 2 : Analyse multidimensionnelle
Matrice de corrélation, diagonalisation, décomposition en vecteurs et valeurs propres, Analyse en Composantes
principales, Analyse canonique, Analyse discriminante, Classification automatique, Introduction à l'analyse
canonique des correspondances ; aides à l'interprétation.
Module 3 : Travail personnel
Les étudiants réaliseront, seuls ou par groupes de deux ou (maximum) trois, un travail personnel consistant en
une analyse d'un jeu de données biologiques et son interprétation. Ces données proviennent de préférence d'une
expérimentation mise en oeuvre par les étudiants eux-mêmes, on encourage le choix d'une expérimentation dans
le cadre du mémoire de fin d'études. Ce travail est l'une des bases de l'évaluation : cf Méthode d'enseignement
et évaluation, ci-dessous.

Autres infos

Le cours est composé d'exposés (24 heures) et de travaux pratiques (36 heures, dont 12 heures de travaux
pratiques dirigés en rapport avec les modules 1 et 2, 21 heures de travaux personnels et 3 heures de monitorat).
Le calendrier détaillé se trouve sur les sites iCampus / webCampus.
L'évaluation vise à mesurer l'acquisition des compétences citées dans les objectifs. Elle porte sur une
présentation orale et sur deux types de rapports à rédiger par les étudiants :
' D'une part, un rapport de chaque exemple qu'ils auront traité lors des travaux pratiques. Ces rapports
sont à remettre à l'assistant chargé des T.P. concernés ; chaque assistant précisera la date limite de
remise des rapports et les règles à suivre pour leur rédaction.
' D'autre part, un rapport du travail personnel, à remettre lors de l'examen.
' Enfin lors de l'examen, les étudiants présenteront par oral leur travail personnel. Pour ces deux derniers
points, rapport et présentation orale, voir le paragraphe Contenu, Module 3. La présentation sera
suivie d'une séance de questions / réponses ; les questions ne sont pas limitées aux seuls points abordés
dans le travail personnel !
L'évaluation portera (1) sur les rapports de Travaux pratiques et (2) sur le travail personnel (présentation,
rapport, réponses aux questions). La moyenne des notes de TPs et la cote de l'oral interviennent à part égale dans
la note finale ; toutefois si l'une ou l'autre de ces notes est inférieure ou égale à 8/20, la note finale sera la plus
basse des deux.
Afin de bénéficier de l'expérience de recherche du second semestre, on encourage fortement la présentation de
l'examen en session de juin.
Une séance de monitorat sera organisée peu avant ou peu après les vacances de Pâques afin de répondre aux
questions; les étudiants dont le canevas de travail pose problème (cf Contenu : Module 3) y seront
spécifiquement convoqués.

Cycle et année
d'étude
> Master [120] en biologie des organismes et écologie
> Master [60] en sciences biologiques
Faculté ou entité
en charge
> BIOL


<<< Page précédente