Type de contrat : Stage
Niveau de diplôme exigé : Bac + 4 ou équivalent
Autre diplôme apprécié : M2 en IA, mathématiques, mathématiques appliquées ou informatique ou équivalent, avec une forte motivation pour la recherche appliquée
Fonction : Stagiaire de la recherche
Ce stage s’inscrit dans un projet plus global visant au profilage vocal explicable et frugal. Le profilage vocal consiste à extraire des informations d’un enregistrement audio comme l’identité, la langue parlée, l’âge, l’origine géographique et ethnique, ou encore des marques socio/patho/physiologiques dans la voix. L’objectif de ce projet est d’apporter une explicabilité aux systèmes de profilage vocal sans perte de performance. L’explicabilité permet en effet de conserver les opérateurs au centre du processus, en leur donnant les moyens d’une décision instruite.
L’approche mise en œuvre dans ce projet repose sur la définition d’un jeu d’attributs vocaux génériques partagés par des groupes d’individus. Seule la présence ou l’absence d’un attribut dans un extrait vocal donné est utilisée pour prendre la décision, menant à une représentation binaire. Cette approche a été introduite pour la tâche de vérification du locuteur.
Ces attributs binaires sont obtenus en deux phases :
– D’abord, un extracteur d’embedding “classique” entraîné pour la détection du locuteur ou de la langue représente un signal vocal de taille variable par un vecteur de taille fixe, un embedding. Récemment, l’emploi de modèles pré-appris géants, comme WavLM, a montré un fort intérêt, en remplacement de l’extracteur “classique”, tant en termes de performances qu’en facilité de déploiement.
– Ensuite, un auto-encodeur binaire spécialement entraîné extrait le vecteur d’attributs binaires depuis cet embedding.
Le stage proposé permet donc de prendre en main les modèles de deep learning en vogue et de travailler à leur spécialisation à des tâches spécifiques. Mais il permet également de s’intéresser à l’explicabilité des modèles en deep learning, une direction qui devient de première importance dans ce domaine, et de découvrir une approche originale en explicabilité.
L’objectif principal du stage proposé est d’étudier et de mettre en œuvre une solution de fine-tuning de l’extracteur par l’auto-encodeur binaire dédié à l’explicabilité. Le travail sera décomposé en trois phases :
L’équipe entourant le stage est composée d’environ dix personnes, réparties sur les sites de Paris et de Grenoble. Le stage se déroulera de préférence à l’Antenne Inria MINATEC Grenoble et sera encadré par Jean-François Bonastre et Solène Evain.
Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.
Sécurité défense :
Ce poste est susceptible d’être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L’autorisation d’accès à une zone est délivrée par le chef d’établissement, après avis ministériel favorable, tel que défini dans l’arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l’annulation du recrutement.
Politique de recrutement :
Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap.
Inria est l’institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l’interface d’autres disciplines. L’institut fait appel à de nombreux talents dans plus d’une quarantaine de métiers différents. 900 personnels d’appui à la recherche et à l’innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'efforce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.