Comment faire pour travailler en tant que freelance ?
- 1 min
- Publié le 18 sept. 2024
Candidature spontanée
L'outil pour les identifier
Modèles lettre de motivation
Lettre de motivation stage
Réussir votre rapport de stage
Prêt pour un entretien ?
Tous les tests carrière
Nos conseils
Trouvez votre job
Trouvez votre entreprise
INFORMATIQUE, TÉLÉCOM - BASES DE DONNÉES - DÉVELOPPEMENT, GÉNIE LOGICIEL - INTELLIGENCE ARTIFICIELLE
Réf. 900283 - publié le 4 septembre 2024
DOMAINE DE FORMATION
Informatique, télécom - Bases de données - Développement, Génie logiciel - Intelligence artificielle
NIVEAU D'ÉTUDES
Bac +5
GRATIFICATION
657
PÉRIODE
Démarrage dès que possible en septembre/début octobre
INFOS LOCALISATION
74 route de Lyons-la-Forêt, 76000 Rouen Proche Tram
EMERIT vous propose une offre de stage dans les domaines Informatique, télécom, Bases de données, Développement, Génie logiciel, Intelligence artificielle à Rouen.
Descriptif du stage
En tant que stagiaire Data Ingénieur / Data Scientist, tu accompagneras nos experts dans la construction d’assistants conversationnels basés sur l’Intelligence Artificielle générative et sur des références scientifiques fiables, à destination de chercheurs et d’ingénieurs (cf. site web : https://emeritscience.com).
L’objectif du stage est de concevoir intégrer et optimiser, pour notre assistant conversationnel Charlie, un système RAG (Retrieval Augmented Generation) basé sur des modèles open source de vectorisation et de génération de textes avec des performances équivalentes ou supérieurs aux modèles propriétaires.
Pour cela, tu travailleras en étroite collaboration avec nos équipes tech et produit, ainsi qu’avec des partenaires technologiques externes.
Le stage pourra évoluer en thèse Cifre (thèse en entreprise)
Tes missions principales :
• Benchmark et veille technologique
o Réalisation d’un benchmark sur les méthodes RAG avec une stack open source (vectorisations, search engines, modèles d’IA générative, cross encoders, …).
o Identification des métriques de scoring, de datasets et de librairies utilisables pour l’évaluation de la qualité des systèmes RAG dans notre contexte.
o Automatisation du processus de veille sur les composants retenus.
• Développement de chaînes de traitements d’acquisition de grands volumes de données
o Design et mise en œuvre de chaînes de traitements big data pour collecter et caractériser des données (acquisition, nettoyage, préparation, analyse qualité et visualisation des données de sources hétérogènes, structurées et non structurées).
o Automatisant des traitements.
o Support aux choix des méthodes RAG et des paramétrages à appliquer en fonction des cas d’usage.
• Développement de méthodes de scoring adaptées à notre contexte
o Construction du score d’évaluation globale ainsi que les scores intermédiaires (recherche, génération, éthique).
o Calcul des scores avant la mise en production, et en automatisation du calcul en production et en fonction de langues.
• Participer au Réalisation de fine tuning de modèles open source
• Optimisation des traitements pour maitriser les coûts et la qualité
• Documentation de l’ensemble des réalisations pour assurer la reproductibilité et la traçabilité
Profil recherché
• Tu es en fin d’étude BAC+5 d’un diplôme d’ingénieur ou un master dans un domaine pertinent (data-science, data-ingénieur, ingénierie, sciences et technologie, mathématique appliquées)
• Tu envisages de poursuivre en doctorat (thèse cifre possible)
• Tu as de solides compétences en programmation, en particulier en Python, avec une expérience pratique dans l’utilisation de bibliothèques telles que langchain, scikit-learn, TensorFlow, Keras ou PyTorch.
• Tu as des connaissances en intelligence artificielle et une bonne compréhension des méthodes de traitements et d’analyse de données à grande échelle en particulier le text-mining.
• Tu connais les méthodologies de développement agile de produits (scrum et kanban).
• Tu connais les processus collaboratifs et outils de développement (DevOps, Git, CI/CD, Jira, Confluence …).
• Tu possèdes un bon niveau en anglais.
• Tu as une vraie soif d’apprendre
Nom du recruteur : Kourlaiev Artem, MENDY Nandjafot