Job : Gestionnaire de corpus de données, UCLouvain

L’Université catholique de Louvain recherche un (h/f) gestionnaire de données

  • à temps partiel (50%) pour une durée déterminée de 18 mois (avec possibilité de prolongation)
  • pour l’Institut langage et communication (ILC), du Secteur des sciences humaines (SSH) – à Louvain-la-Neuve
  • entrée en fonction: immédiate

Contexte

La recherche actuelle fait un usage massif de données langagières écrites et orales, dans différentes langues (français, espagnol, anglais, néerlandais, etc.). Pour être exploitables, ces données langagières doivent être documentées (métadonnées), anonymisées (afin de respecter les règles sur les donnéespersonnelles), enrichies d’annotations (transcription, indexation, analyse thématique, etc.) et déposéesdans des bases de données interrogeables en ligne. C’est à ces différentes tâches que le·la gestionnaire de données contribuera au sein de l’Institut Langage et Communication (ILC), et plus particulièrement dupôle de recherche en linguistique (PLIN) et de la plateforme CENTAL (Centre de Traitement automatique du langage).

Fonction

En collaboration avec les chercheurs de ILC/PLIN, le·la gestionnaire de données a pour fonctions de :

  • Superviser la chaine de traitement de constitution des corpus oraux et écrit (acquisition des données, documentation des métadonnées, transcriptions et annotations, versement dans les bases de données existantes, standardisation des formats utilisés)
  • Développer des outils de prétraitement et de traitement des données (segmentation, alignement du texte au son, alignement texte-texte, annotation automatique ou semi- automatique, etc.)
  • Assurer une veille technologique pour l’interopérabilité des données (documentées et traitées selon les standards internationaux, cf. Clarin, Ortolang, Olac, etc.) et l’amélioration de l’acquisition des données (automatic speech recognition, tokenisation, etc.)
  • Veiller au respect des conventions juridiques et éthiques liées à la protection des données (RGPD)
  • Représenter l’UCL dans différents consortiums internationaux des données en linguistique.Qualifications et aptitudes requises

    Le·la candidate répondra aux qualifications suivantes :

    • titulaire d’un diplôme de Master en Linguistique, Finalité spécialisée en Traitement automatique

      du langage, ou équivalent

    • compétences de programmation : Perl et/ou Python, bonne connaissance du XML
    • capacité à traiter des données langagières dans plusieurs langues (français, anglais, néerlandais,

      espagnol, allemand, etc.)

    • connaissance de l’anglais (B2) et en particulier de l’anglais académique (pour participer à des

      réunions internationales et contribuer aux publications de recherche)

    • sens du travail en équipe, capacité d’écoute et d’analyse des besoins, réactivité

Votre candidature

(lettre de candidature, curriculum vitae, photo récente en format d’identité) est à transmettre :Par e-mail (de préférence) à l’adresse : anne-catherine.simon@uclouvain.be

OU par la poste, à l’adresse:

Université Catholique de Louvain
Institut Langage et Communication (ILC) Anne Catherine SIMON
Place Blaise Pascal, 1 – Boite L3.03.33 B-1348 Louvain-la-Neuve