Ingénieur de recherche (H/F) en traitement automatique des langues

Faites partie des premiers candidats.
CNRS
Gif-sur-Yvette
EUR 60 000 - 80 000
Faites partie des premiers candidats.
Il y a 2 jours
Description du poste

Portail > Offres > Offre UMR9015-THOGER-006 - Ingénieur de recherche (H/F) en traitement automatique des langues

Ingénieur de recherche (H/F) en traitement automatique des langues

Date Limite Candidature : jeudi 13 mars 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler.

Informations générales

Intitulé de l'offre : Ingénieur de recherche (H/F) en traitement automatique des langues
Référence : UMR9015-THOGER-006
Nombre de Postes : 1
Lieu de travail : GIF SUR YVETTE
Date de publication : jeudi 20 février 2025
Type de contrat : IT en contrat CDD
Durée du contrat : 9 mois
Date d'embauche prévue : 1 avril 2025
Quotité de travail : Complet
Rémunération : à partir de 2932,84€ mois
Niveau d'études souhaité : BAC+5
Expérience souhaitée : Indifférent
BAP : E - Informatique, Statistiques et Calcul scientifique
Emploi type : Expert-e en information statistique

Missions

Le poste proposé s'inscrit dans le cadre de deux projets actuellement en développement au sein du laboratoire LISN. Le travail sera décomposé en deux parties :

  1. Création d'un corpus annoté en question-réponse : Ce corpus portera sur des documents comportant à la fois des données textuelles et visuelles. Les trois premiers mois seront consacrés à la création d'un corpus de question-réponse sur des documents scolaires, portant sur des diagrammes/images, du texte et des énoncés mathématiques.
  2. Traitement de la parole : Mise en place d'un système de reconnaissance de la parole avec des sorties structurées, conception de méthodes d'évaluation et mise en place d'une démonstration.

Activités

Partie 1 : Corpus multimodal sur des documents scolaires

* Pilotage d'une équipe pour la conception d'un corpus multimodal contenant à la fois des images et du texte sur des documents éducatifs.
* Conception de méthodes statistiques innovantes pour l'évaluation de systèmes génératifs.
* Pilotage d'une campagne d'évaluation du corpus produit.

Partie 2 : Transduction de formules mathématiques à partir de la parole

* Pilotage du pôle 'inférence structurée' de la plateforme open-source PTAL.
* Supervision de la conception d'un système de transcription de la parole en LaTeX.

Missions communes :
* Participation à l'animation scientifique du groupe de recherche.
* Aide et support technique aux activités de recherche.

Compétences

- Formation d'ingénieur ou équivalent (master en informatique et/ou traitement des langues)
- Expérience dans la mise en place de campagne d'évaluation et/ou d'annotation
- Supervision dans la rédaction d'articles scientifiques
- Veille scientifique
- Rôle de conseil et d'expertise dans le cadre des projets

- Compétences techniques :
* Maîtrise des méthodes d'apprentissage statistique
* Connaissance des outils du TAL
* Approches et outils pour l'apprentissage profond

Nous recherchons des personnes avec un fort intérêt pour les problématiques de l'accessibilité des technologies du traitement automatique des langues.

Contexte de travail

Le travail se déroulera au Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) sur le site 'Belvédère'. Le candidat travaillera avec l'équipe M3 et l'équipe SEME du département STL.

Contraintes et risques

Travail sur écran.

Obtenez un examen gratuit et confidentiel de votre CV.
Sélectionnez le fichier ou faites-le glisser pour le déposer
Avatar
Coaching en ligne gratuit
Multipliez vos chances de décrocher un entretien !
Faites partie des premiers à découvrir de nouveaux postes de Ingénieur de recherche (H/F) en traitement automatique des langues à Gif-sur-Yvette