Stagiaire Data Scientist - Products Data (H/F)

BearingPoint France

Courbevoie

EUR 80 000 - 100 000

Description du poste

Stagiaire Data Scientist - Products Data (H/F)

BearingPoint est un cabinet de Conseil référent qui a investi depuis une décennie dans l’IA et le Machine Learning.

L’équipe Products, notre Data Factory, réunit aujourd’hui un spectre large de compétences et d’expertises (data engineer, data scientist, devops, dev full stack, architecte, RPA) mobilisées au quotidien dans le Build et le Run d’applications commercialisées en mode SaaS. Elles couvrent des domaines variés (pricing, prévision des ventes, risque crédit, prévisions RH) que nous allons enrichir ensemble.

Nous recherchons deux Stagiaires Data Scientist pour renforcer notre équipe technique.

Vous travaillerez sur l’un des deux sujets :

1. DemandSens : LLMs IA Générative pour l'Analyse de Manuscrits

DemandSens est une solution logicielle SaaS (AWS) dédiée à l’industrie de la presse quotidienne, magazine et de l'édition. Grâce à l'IA, DemandSens permet de repenser et d’améliorer les processus de distribution, la prévision des ventes ainsi que les décisions de tirage.

Le nouveau projet se concentre sur l’application des technologies LLMs et d’IA Générative pour analyser et enrichir les manuscrits de livres, avec des objectifs tels que la génération de résumés, l’identification des thèmes et des personnages, ainsi que l’élaboration de fiches descriptives. Le projet explore également la mise en place d'un système RAG (Retrieval-Augmented Generation) et la faisabilité d’utiliser les informations extraites pour prédire le potentiel de vente d’un livre.

Pour en savoir plus sur l’équipe produit DemandSens, n’hésitez pas à visiter notre site !

Dans le cadre de ce stage, vous serez amené(e) à :

Réaliser un état de l’art des modèles LLMs et IA Générative existants.
Concevoir et développer des solutions d’IA permettant de générer un résumé complet à partir d’un manuscrit, d’identifier les principaux thèmes, mots-clés du texte, de décrire les personnages principaux à l’aide de fiches descriptives, de mettre en place un système RAG (Retrieval-Augmented Generation) pour permettre la recherche d’informations pertinentes à partir du manuscrie, d’extraire et générer des informations utiles aux objectifs marketing, d’explorer la faisabilité d’utiliser les informations tirées des manuscrits pour prédire le potentiel de vente de développer une interface utilisateur (UI) pour créer une démo présentant les fonctionnalités précédemment développées.
Développer une interface utilisateur (UI) pour présenter ces fonctionnalités.
Collaborer avec les data engineers pour intégrer et déployer les modèles dans un environnement de production.
Assurer une veille technologique et algorithmiques continue sur les avancées en LLMs et IA Générative.

2. Sellia : LLMs IA Générative pour le Crédit Management

Sellia est conçue pour optimiser les processus de vente, évaluer le risque de solvabilité en temps réel et fournir une visibilité à 360° sur les clients. Elle aide les entreprises à prendre des décisions éclairées concernant leurs prospects et clients grâce à ses capacités avancées de prédiction et d'analyse des risques financiers

Le nouveau projet implique l’utilisation des LLMs (Large Language Models) et de l'IA Générative pour assister les credit managers dans la gestion de leur portefeuille.

Pour en savoir plus sur notre produit Sellia, n’hésitez pas à visiter notre site !

Dans le cadre de ce stage, vous serez amené(e) à :

Réaliser un état de l’art des modèles LLMs et IA Générative existants.
Concevoir et développer des solutions d’IA permettant de générer un rapport complet sur l’état financier d'une entreprise et évaluer le risque de la prendre comme client, à partir des sources externes et des données propriétaires de Sellia, d’investiguer la faisabilité d'utiliser l’IA Générative pour proposer aux credit managers la meilleure action suivante en fonction des prédictions issues des modèles de machine learning déjà développés dans Sellia et dutiliser l’IA Générative pour fournir une explication claire aux utilisateurs finaux sur les décisions prises par les modèles prédictifs (risque de faillite, retard de paiement, limite de crédit) en se basant sur l’importance des features.
Collaborer avec les data engineers pour intégrer et déployer les modèles dans un environnement de production.
Assurer une veille technologique et algorithmiques continue sur les avancées en LLMs et IA Générative.

Votre profil :

Vous êtes en Master 2 ou en troisième année d'une école d’ingénieur avec une spécialisation en Data Science, IA ou Machine Learning.
Vous possédez une première expérience en Data Science, notamment dans l’utilisation de modèles LLMs et d’algorithmes d’IA Générative.
Vous maîtrisez les concepts et techniques du machine learning, ainsi que les outils et langages associés, en particulier Python.
Vous êtes curieux(se) et avez un intérêt pour les modèles open-source et les technologies IA de pointe.
Vous savez collaborer en équipe, mener des projets de bout en bout, et communiquer efficacement en français et en anglais.

Vous êtes à l’aise avec les technologies suivantes ou souhaitez-vous former davantage :

Systèmes : Windows, Linux (Ubuntu, WSL2).
Data Science/ML: Pandas, Scikit-learn, PyTorch, Hugging Face, transformers, modèles de langage, modèles d'IA Générative
Bases de données : postgreSQL, bases de données vectorielles
Conteneurs : Docker/Podman
Langues : Français et Anglais

Vous souhaitez construire une carrière dynamique et évolutive ?

Nous vous accompagnons au quotidien dans le développement de vos compétences grâce à des formations sur mesure et des certifications. Vos appétences et souhaits d’évolution sont également considérés pour vous permettre de réussir professionnellement et vous épanouir personnellement.

Un métier, des missions, et un environnement de travail attractifs

Un mode de travail hybride, flexible et collaboratif

Un parcours de carrière dynamique et personnalisé

Des moments fédérateurs et festifs

La possibilité de soutenir des projets sociaux, sociétaux et environnementaux

Et d'autres avantages attractifs : carte Swile, Gymlib, subvention télétravail, espaces de coworking, mobilité durable, parentalité...

La société BearingPoint s’engage à respecter la loi n° 2004-1486 du 30 décembre 2004 contre les discriminations et pour l’égalité des chances. Les informations demandées au candidat concernent uniquement sa capacité à occuper l'emploi proposé et ses aptitudes professionnelles.

Attention - ne fournissez jamais d'informations sur votre compte bancaire ou votre carte de crédit quand vous postulez à un emploi. Ne transférez pas d'argent. Si vous constatez quelque chose de suspect, signalez l'annonce via ce lien .

Obtenez un examen gratuit et confidentiel de votre CV.

Sélectionnez le fichier ou faites-le glisser pour le déposer