Systèmes d'information
Peut-on appliquer une méthode de réduction des tokens généralisée aux modèles ViT multitâches ? H/F
Les Vision Transformers (ViT) ont révolutionné le domaine de la vision par ordinateur en atteignant des performances de pointe dans une large gamme de tâches, telles que la classification d'images, la segmentation, l'estimation de profondeur, la détection d'objets et l'analyse du flux optique. Cependant, leurs exigences élevées en termes de calcul et de mémoire restent des obstacles importants à leur déploiement en temps réel et dans des environnements aux ressources limitées. Pour relever ces défis, les techniques de réduction des modèles sont essentielles, offrant un moyen de diminuer la complexité tout en préservant les performances. Ce stage vise à développer une stratégie polyvalente et efficace de réduction des tokens pour optimiser les performances des modèles ViT sur diverses tâches, tout en réduisant la charge computationnelle. Les résultats permettront d'adapter les modèles ViT aux applications multitâches, où précision et efficacité sont cruciales.
6 mois
L'objectif de ce stage est d'identifier une solution généralisable permettant au modèle de bien performer sur plusieurs tâches, tout en minimisant le compromis entre la performance, la complexité du modèle et l'efficacité des ressources. Plus précisément, ce stage s'appuiera sur une approche hybride de réduction des tokens, développée dans notre laboratoire pour la segmentation sémantique. Cette méthode combine la fusion des tokens, qui réduit le nombre de tokens à traiter par le transformeur, avec une stratégie de sortie anticipée, permettant au modèle de stopper les calculs lorsque les couches intermédiaires atteignent un niveau de confiance suffisant. Le principal objectif de ce travail est d'évaluer l'efficacité de cette méthode sur diverses tâches et d'explorer les optimisations potentielles pour la fusion des tokens. Sur la base de ces évaluations, nous visons à déterminer si le système actuel de réduction des tokens hybride est suffisant pour maintenir les performances sur toutes les tâches ou si des modifications spécifiques à chaque tâche sont nécessaires.
Dans ce contexte, les objectifs du stage sont les suivants :
Conformément aux engagements pris par le CEA en faveur de l’intégration de personnes en situation de handicap, cet emploi est ouvert à tous et tout es.
Langage C/C++, Python, IA, traitement d'image, Linux
Non spécifiée
Ingénieur/Master
2024-33182
Le Commissariat à l'Energie Atomique et aux Energies Alternatives (CEA) est un acteur majeur en matière de recherche, de développement et d'innovation. Cet organisme de recherche technologique intervient dans trois grands domaines : l'énergie, les technologies pour l'information et la santé et la défense. Reconnu comme un expert dans ses domaines de compétences, le CEA est pleinement inséré dans l'espace européen de la recherche et exerce une présence croissante au niveau international. Situé en île de France sud (Saclay), le Laboratoire d'Intégration des Systèmes et des Technologies (LIST) a notamment pour mission de contribuer au transfert de technologies et de favoriser l'innovation dans le domaine des systèmes embarqués. Au sein du LIST, le Laboratoire Intelligence Artificielle Embarquée (LIAE) est chargé de concevoir, de développer et de mettre en œuvre des solutions optimisées (surface, consommation, puissance de calcul) pour les systèmes embarqués.