Augmentation du Smic (et du salaire des alternants) de 2% le 1er novembre 2024
- 1 min
- Publié le 31 oct. 2024
Candidature spontanée
L'outil pour les identifier
Modèles lettre de motivation
Lettre de motivation stage
Réussir votre rapport de stage
Prêt pour un entretien ?
Tous les tests carrière
Nos conseils
Trouvez votre job
Trouvez votre entreprise
INFORMATIQUE -TÉLÉCOM - CONSTRUCTEURS, HARDWARE - EDITEURS LOGICIELS, SOFTWARE - MULTIMÉDIA ET INTERNET...
Réf. 1003901 - publié le 21 octobre 2024
DOMAINE DE FORMATION
Informatique -Télécom - Constructeurs, Hardware - Editeurs logiciels, Software - Multimédia et Internet - SSII - Télécom
NIVEAU D'ÉTUDES
Bac +5
GRATIFICATION
1200 2000 MOIS
Orange SA vous propose une offre de stage dans les domaines Informatique -Télécom, Constructeurs, Hardware, Editeurs logiciels, Software, Multimédia et Internet,... à Lannion.
Contexte: Dans de nombreuses situations réelles, l'imprécision, l'incertitude ou la variabilité peuvent être présentes dans certaines données collectées. Dans ce cas les données utilisées ne sont pas des valeurs précises, ponctuelles mais des données à valeur d'intervalle . On parle de " Interval-Valued Data " (IVD). Par rapport aux données " ponctuelles ", l'IVD peut exprimer l'incertitude et la variabilité des données. Apprendre un modèle de machine learning qui se base sur ce type de données requiert parfois de transformer la valeur " intervalle " en une autre représentation (1).
Mission : Après l'étude menée dans (1), on cherchera à étendre ces travaux en (re)réalisant leur étude mais aussi en testant d'autres formes de représentation (tel que par exemple un simple " one hot encoding " (2) des intervalles de valeurs). Pour ce faire :
(i) un travail raisonnable de bibliographie sera à réaliser
(ii) un benchmark sera à réaliser versus :
(a) plusieurs classifieurs (données ponctuelles 1)
(b) plusieurs représentations
(c) potentiellement à plusieurs types d'IVD
(d) et enfin sur plusieurs jeux de données
Références bibliographiques :
(1) "An Interval-Valued Data Classification Method Based on the Unified Representation Frame", 2020, IEEE Open Access, Xiaobo Qi, Husheng Guo, Zadorozhnyi Artem and Wenjian Wang
(2) "A benchmark of categorical encoders for binary classification", 2023, NeurIPS Datasets and Benchmarks Track, Federico Matteucci, Vadim Arzamasov and Klemens Böhm
(1) A priori l'étude ne s'intéressera pas aux modèles dédiés aux données IVD tel que : " Binary classification SVM-based algorithms with interval-valued training data using triangular and Epanechnikov kernels", " Lev V. Utkin et al, Neural Networks, 2016.; ou encore "A pattern classifier for interval-valued data based on multinomial logistic regression model," 2012 IEEE International Conference on Systems, Man, and Cybernetics (SMC), A. P. de Barros, et al.
Le profil souhaité est BAC + 5, Master Industriel (ou recherche) informatique et/ou statistiques ou école d'ingénieur.
Data scientist avec goût pour l'informatique et les mathématiques appliquées ; si possible ayant suivi des cours, TP, stage sur les séries temporelles
Les connaissances en Python, Scikit-learn ... sont indispensables.
Nom du recruteur : Cecile MATEO