Employé de Cafétéria • Antibes
Dernière mise à jour: il y a 7 heures
Contexte et atouts du poste
Inria, l'Institut national français d'informatique et de mathématiques appliquées, promeut "l'excellence scientifique au service du transfert de technologie et de la société".
Diplômés des plus grandes universités mondiales, les 2 700 collaborateurs d'Inria relèvent les défis des sciences numériques. Grâce à son modèle ouvert et agile, Inria est en mesure d'explorer des approches originales avec ses partenaires industriels et académiques et de répondre efficacement aux défis pluridisciplinaires et applicatifs de la transformation numérique. Inria est à l'origine de nombreuses innovations qui apportent de la valeur ajoutée et créent des emplois.
Equipe :
L'équipe de recherche STARS associe une théorie avancée à une pratique de pointe axée sur les systèmes de vision cognitive.
Mission confiée
1 - Objet de la thèse
Dans ce projet de thèse, nous visons à concevoir un nouveau modèle de fondation unifiant séquences de squelettes (i.e., postures des personnes) et actions RVB, pour cibler à la fois la classification et la segmentation des actions humaines à partir de flux vidéo acquis par des drones. Ce modèle de fondation traitera les séquences de squelettes humains ou les clips vidéo RVB en utilisant une architecture Transformer pour extraire des caractéristiques génériques.
2 - Descriptif (objectifs, aspects innovants)
Les problèmes posés par ce travail de thèse consistent principalement à concevoir un nouveau modèle de fondation unifiant les séquences de squelettes (i.e., posture 2D ou 3D) et les actions RVB sémantiques. Un premier défi consiste à rassembler suffisamment de données pour l’entraînement du modèle, rassemblant en même temps des actions RVB et des annotations de squelettes suffisamment précises. Un autre défi est d’arriver à construire un modèle générique unifiant des données hétérogènes comme le sont les données squelettes par rapport aux actions RVB et aux données textes (i.e., sémantiques). Pour cela, il faudra concevoir des pré-taches d’auto-apprentissage spécifiques permettant de construire un modèle générant des représentations génériques d’actions humaines à partir de flux vidéo acquis par des drones.
Principales activités
Les contributions de cette thèse de doctorat seront les suivantes :
L’objectif est d’avoir un modèle de fondation suffisamment générique pour être directement utilisable sur de nouvelles vidéos de drones. Pour valider ce modèle, on le testera sur de nouvelles vidéos qui n’auront pas été observées et n’appartenant pas à l’ensemble d’apprentissage. Ce modèle de fondation pourra être utilisé dans une large gamme d’applications, par exemple comme la gestion de catastrophes naturelles. Ainsi, un drone envoyé sur un terrain d’observation pourra par lui-même automatiquement détecter des situations d’urgence, par exemple, une personne faisant des signes de détresse et envoyer une alerte directement au poste de commandement ou poste de secours.
Compétences
Avantages
Rémunération
2100€ brut mensuel (année 1 & 2) et 2190€ brut mensuel (année 3)