Programme d'études 2002-2003 > SC > BIOL3103
BIOL3103Analyse des données biologiques

[15h+15h]1q

Enseignant(s) :

Marc Dufrêne

Objectifs

L'étudiant sera capable:
1° de définir de manière concise la ou les questions qu'il a à résoudre, la structure du protocole expérimental nécessaire et les types de données qui sont attendus;
2° de définir les structures de gestion de ces données qui sont les plus efficaces;
3° d'identifier les méthodes statistiques, inférentielles traditionnelles, mais surtout les méthodes descriptives multivariées qui, en fonction des questions posées et de la structure des données, sont d'application;
4° rédiger un programme de gestion, de manipulation et d'analyse de données avec un langage évolué comme SAS;
5° comprendre les listings et les résultats obtenus.Le cours est basé principalement sur des exemples relevant du domaine de l'écologie mais pas exclusivement.

Cahier des charges

Au sein de cet enseignement, on initiera d'abord l'étudiant à l'emploi d'un langage de programmation et surtout à l'usage des logiciels disponibles. Puis on discutera des différentes mesures de ressemblance (coefficients de similarité, de distance, de dépendance). On examinera différentes méthodes de groupement d'objet (méthodes divisives ou agglomératives, avec ou sans hiérarchie) ainsi que les techniques de représentation graphique des liens. Enfin on examinera les méthodes d'ordination en espace réduit (analyse en composantes principales, analyse des correspondances, analyse factorielle). L'accent sera porté essentiellement sur l'interprétation biologique des résultats de ces différentes approches plutôt que sur la mathématique sous-jacente.

Résumé

Le cours débute par une analyse d'études de cas, partant des questions posées, du protocole proposée, de la gestion des données récoltées et des analyses effectuées. On définira ensuite les grandes règles de gestion de données biologiques et en particulier, des données écologiques. On détaillera les bases essentielles du langage SAS de gestion et d'analyse de données en mettant d'abord l'accent sur la manipulation et la gestion des données. Ensuite, après une présentation des principales méthodes multivariées, on réalisera une série d'analyses avec le logiciel SAS. Le cours est basé sur une grande interaction entre la partie théorique et pratique (sur ordinateur) qui sont souvent confondues. Dès le début du cours, l'étudiant est amené à réaliser, seul ou en petits groupes, et en-dehors du cours, une série de problèmes dont les différentes solutions sont débattues au cours. Par ailleurs, les étudiants sont aussi amenés à présenter l'un ou l'autre problème personnel de gestion ou d'analyse de données auxquels ils sont confrontés pour d'autres cours ou pour leurs travaux de fin d'études.
Méthodes: Confrontation systématique de la théorie par des exemples pratiques, sur ordinateur. Travaux personnels continus (problèmes à résoudre) de manière à devenir le plus vite possible autonome avec la logique et le langage SAS. L'étudiant est sensé avoir des problèmes d'analyses de données personnelles (autres cours ou travaux de fin d'étude) à résoudre.

Autres informations du cahier des charges

Prérequis : Connaissance indispensable des méthodes statistiques inférentielles habituelles (cours de statistiques) - maîtrise relative de l'ordinateur et des logiciels de bureaucratique habituels.
Evaluation : Examen sur la base d'un problème de gestion, de manipulation et d'analyse de données à résoudre à l'ordinateur.
Support : Page Web, Forum.

Le cours BIOL3103 est mentionné dans les programmes suivants :

SC3DA

Diplôme d'études approfondies en sciences

SC3DA/B

Diplôme d'études approfondies en sciences (Biologie)

Valeurs ECTS de l'activité

Valeur ECTS par défaut

(2.5 ECTS)


Programme d'études 2002-2003 > SC > BIOL3103

Recherche - Aide - Renseignements généraux

[UCL] [Site Web Facultaire] [Pointeurs utiles]

Responsable : Jean-Louis Marchand
Contact : info@sc.ucl.ac.be