Témoignage métier : data scientist

Data Scientist

Cannelle est une jeune ingénieure diplômée de Polytech Nice-Sophia, passionnée par les problématiques de traitement de la donnée dans un contexte Big Data. Elle nous présente son parcours, son métier de data scientist et nous parle de son expérience chez AViSTO.

métier-data-scientist

Q : Dans le monde du big data, es-tu data scientist ou data analyst ? Mon métier est relativement récent, donc la définition n’est pas encore figée. Pour moi, le data analyst est une personne qui va se charger principalement de l’analyse des données ; tandis que le data scientist s’occupe également de la partie étude et algorithmie. Je me définis donc comme data scientist, mais ce n’est que mon interprétation ! Q : Peux-tu nous présenter ton parcours ? Je suis diplômée de Polytech Nice-Sophia, filière mathématiques appliquées et modélisation. En master 2, je me suis spécialisée dans le traitement de la donnée big data. Cette formation en mathématiques et informatique m’a permis de mêler les aspects théoriques et pratiques afin de mieux appréhender les problèmes complexes. Q : En quoi consiste ton métier de data scientist ? Pour moi, le data scientist est une personne qui doit être capable de porter plusieurs casquettes, qui doit posséder diverses compétences. Il y a :
  • Le côté fonctionnel, pour appréhender le métier du client, son activité. C’est nécessaire pour comprendre la donnée, l’utiliser et la représenter.
  • Le côté étude, pour concevoir des algorithmes mathématiques adaptés. Pour ce faire, on lit des articles scientifiques, ou bien on les crée nous-mêmes.
  • Le côté développement : une fois l’algorithme conçu, on va le coder dans un langage de programmation adapté. Habituellement, dans le monde de l’entreprise, on va utiliser le langage Python ; dans le domaine de la recherche, ça sera souvent le langage R.

Une fois l’algorithme codé, on va l’inclure dans un logiciel de traitement de données ; c’est souvent celui déjà utilisé par l’entreprise, mais on peut être amené à réaliser une étude pour vérifier s’il n’y en a pas un autre encore mieux adapté au traitement de la donnée étudiée.
Enfin, dans le domaine du big data, on doit prendre en compte la question du traitement distribué, ou parallélisme. Aujourd’hui, les calculs sont de plus en plus souvent réalisés sur de petits serveurs distribués, et non plus sur un unique gros serveur.
Q : Le domaine du big data est en pleine ébullition. Comment te tiens-tu au courant de toutes les dernières avancées ? Je réalise une veille aussi bien technologique qu’algorithmique. Mon process n’est pas très formalisé, je me laisse guider par mon intérêt et mon intuition. Par exemple, en début d’année, AlphaGo et son algorithme de machine learning a vaincu le champion du monde de Go. Quand j’en ai entendu parler, j’ai fait une petite recherche sur Internet pour comprendre comment fonctionnait l’algorithme.
Sinon, je vais à des conférences également ; par exemple, j’ai récemment assisté à Riviera Dev à Sophia Antipolis (N.D.L.R : un événement sponsorisé par AViSTO ; lire l'article à ce sujet) ou à SophiaConf.
Mais il y en a tellement de nouveautés que je ne peux bien entendu pas tout regarder, je me tiens donc au moins informée de la sortie des dernières technologies.
Q : Qu’est-ce qui te plaît dans ton métier de data scientist ? J’aime rendre la donnée brut exploitable, produire du concret qui puisse être compris par l’être humain. J’aime utiliser des traitements mathématiques (des algorithmes etc), ou de nouveaux frameworks de traitement de données distribuées (ex : Hadoop, ou Spark) pour transcrire la donnée.
J’aime particulièrement le challenge du temps réel, où les algorithmes sont pensés différemment pour être plus légers et exploitables.
Pour résumer, lier l’informatique et les mathématiques pour produire de la valeur, c’est ce qui me plaît vraiment.
Q : Qu’est-ce qui t’a donné envie de faire ce métier de data scientist ? J’ai toujours eu le goût des mathématiques depuis que je les étudie. En école d’ingénieur, j’ai découvert l’informatique, ça m’a beaucoup plu aussi. J’ai donc eu envie de trouver un métier qui me permette d’exercer les deux.
Par ailleurs, j’ai toujours été intéressée par la créativité et l’innovation : manipuler les données peut prendre de multiples formes, cela requiert de la créativité et un état d’esprit innovant.
Q : Et comment as-tu fait pour le trouver ce métier de data scientist ? J’ai découvert le processus de traitement de données par l’intermédiaire de stages en traitement d’images, notamment chez Wildmoka, une start-up de Sophia-Antipolis. Le traitement d’images est un domaine d’application du traitement de données. C’est comme ça que j’en suis venue à la data science (la science des données) en général. Q : Que peux-tu nous dire de ton expérience chez AViSTO ? Grâce à AViSTO, j'ai la possibilité de travailler avec des acteurs émergents, dans un contexte challengeant. Les problématiques que je traite portent sur de la donnée typée événement, ce qui implique du traitement temps réel.
AViSTO me permet également de me tenir proche des dernières technologies utilisées, en proposant des formations comme la certification Cassandra Développeur de Datastax, ou encore en subventionnant la participation aux conférences de la technopole de Sophia Antipolis sur les innovations et nouvelles technologies, comme la Riviera Dev.
Je remercie vraiment AViSTO pour tout ça, particulièrement Jean-François, mon responsable d’affaires, avec qui je m’entends très bien.

Exemples de projets :

  • Mise en place d’une solution de Business Intelligence « from scratch » pour exploiter les données issues des boutiques d’un grand aéroport international.
  • Mise en place d’une solution de big data – business intelligence permettant d’analyser les données d’utilisation du parc de véhicules électriques d’une grande entreprise.

Site carrières d'AViSTO

Nos dernières offres d'emploi

Un grand merci à Cannelle pour son témoignage !
Cannelle

French