Phoenix CMS Accéder au BO

INFORMATIQUE, TÉLÉCOM - BASES DE DONNÉES - DÉVELOPPEMENT, GÉNIE LOGICIEL - INTELLIGENCE ARTIFICIELLE

Stage Data Ingénieur / Data Scientist


EMERIT
Rouen

Réf. 900283 - publié le 4 septembre 2024


M'alerter sur les offres

Informations générales

DOMAINE DE FORMATION

Informatique, télécom - Bases de données - Développement, Génie logiciel - Intelligence artificielle

NIVEAU D'ÉTUDES

Bac +5

GRATIFICATION

657

PÉRIODE

Démarrage dès que possible en septembre/début octobre

INFOS LOCALISATION

74 route de Lyons-la-Forêt, 76000 Rouen Proche Tram



Missions

EMERIT vous propose une offre de stage dans les domaines Informatique, télécom, Bases de données, Développement, Génie logiciel, Intelligence artificielle à Rouen.

Descriptif du stage
En tant que stagiaire Data Ingénieur / Data Scientist, tu accompagneras nos experts dans la construction d’assistants conversationnels basés sur l’Intelligence Artificielle générative et sur des références scientifiques fiables, à destination de chercheurs et d’ingénieurs (cf. site web : https://emeritscience.com).

L’objectif du stage est de concevoir intégrer et optimiser, pour notre assistant conversationnel Charlie, un système RAG (Retrieval Augmented Generation) basé sur des modèles open source de vectorisation et de génération de textes avec des performances équivalentes ou supérieurs aux modèles propriétaires.
Pour cela, tu travailleras en étroite collaboration avec nos équipes tech et produit, ainsi qu’avec des partenaires technologiques externes.
Le stage pourra évoluer en thèse Cifre (thèse en entreprise)

Tes missions principales :
• Benchmark et veille technologique
o Réalisation d’un benchmark sur les méthodes RAG avec une stack open source (vectorisations, search engines, modèles d’IA générative, cross encoders, …).
o Identification des métriques de scoring, de datasets et de librairies utilisables pour l’évaluation de la qualité des systèmes RAG dans notre contexte.
o Automatisation du processus de veille sur les composants retenus.
• Développement de chaînes de traitements d’acquisition de grands volumes de données
o Design et mise en œuvre de chaînes de traitements big data pour collecter et caractériser des données (acquisition, nettoyage, préparation, analyse qualité et visualisation des données de sources hétérogènes, structurées et non structurées).
o Automatisant des traitements.
o Support aux choix des méthodes RAG et des paramétrages à appliquer en fonction des cas d’usage.
• Développement de méthodes de scoring adaptées à notre contexte
o Construction du score d’évaluation globale ainsi que les scores intermédiaires (recherche, génération, éthique).
o Calcul des scores avant la mise en production, et en automatisation du calcul en production et en fonction de langues.
• Participer au Réalisation de fine tuning de modèles open source
• Optimisation des traitements pour maitriser les coûts et la qualité
• Documentation de l’ensemble des réalisations pour assurer la reproductibilité et la traçabilité


Profil

Profil recherché
• Tu es en fin d’étude BAC+5 d’un diplôme d’ingénieur ou un master dans un domaine pertinent (data-science, data-ingénieur, ingénierie, sciences et technologie, mathématique appliquées)
• Tu envisages de poursuivre en doctorat (thèse cifre possible)
• Tu as de solides compétences en programmation, en particulier en Python, avec une expérience pratique dans l’utilisation de bibliothèques telles que langchain, scikit-learn, TensorFlow, Keras ou PyTorch.
• Tu as des connaissances en intelligence artificielle et une bonne compréhension des méthodes de traitements et d’analyse de données à grande échelle en particulier le text-mining.
• Tu connais les méthodologies de développement agile de produits (scrum et kanban).
• Tu connais les processus collaboratifs et outils de développement (DevOps, Git, CI/CD, Jira, Confluence …).
• Tu possèdes un bon niveau en anglais.
• Tu as une vraie soif d’apprendre


Postuler

Nom du recruteur : Kourlaiev Artem, MENDY Nandjafot


Offres similaires

Stages à la une

Nos sélections d'offres de stages

Les articles en lien

Partagez sur les réseaux sociaux !