Avisto : société

Data Scientist

Data Scientist - Fiche Métier

Découvrez le métier de data scientist : formation, profil, compétences, salaire et offres d’emploi. Cette fiche métier a été réalisée en collaboration avec Cannelle, data scientist chez AViSTO.

métier-data-scientist

Définition : Data scientist ou data analyst ?

Le métier étant relativement récent, sa définition n’est pas encore figée. Voici une interprétation :

  • Le data analyst est une personne qui va se charger principalement de l’analyse des données, par exemple en utilisant des logiciels tableurs, en élaborant des requêtes SQL, ou par le biais de tableaux de bord.
  • Le data scientist, pour sa part, s’occupe de toute la chaîne de traitement de la donnée - de l'acquisition à la manipulation - dans le but de la transformer, avec un accent sur l'algorithmie avancée et la programmation.

Description du métier et compétences

Le data scientist doit être capable de porter plusieurs casquettes, et doit donc posséder diverses compétences. Il y a :

  • Le côté fonctionnel, pour appréhender le métier du client, son activité. C’est nécessaire pour comprendre la donnée, l’utiliser et la représenter.
  • Le côté étude, pour concevoir des algorithmes mathématiques adaptés. Pour ce faire, le data scientist lit des articles scientifiques, ou bien crée lui-même les algorithmes.
  • Le côté développement : une fois l’algorithme conçu et après la phase de pré-processing, qui consiste à nettoyer et à former la donnée, le data scientist va le coder dans un langage de programmation. Ce dernier est souvent choisi en fonction des possibilités offertes par ses librairies en termes d'implémentation des algorithmes, d'outils de manipulations mathématiques, ou de performances. Habituellement, dans le monde de l’entreprise, on va utiliser le langage Python ; dans le domaine de la recherche, ça sera souvent le langage R. A noter que beaucoup d'entreprises choisissent de ré-implémenter l'algorithme dans leur langage privilégié (en java par exemple).
  • Dernier point, le data scientist doit savoir communiquer les résultats à partir de données brutes quantitatives dans un langage non technique, compréhensible par tout le monde. La visualisation entre beaucoup en jeu à ce moment-là.

Généralement, le data scientist s’occupe aussi bien du développement de l’algorithme que de sa mise en œuvre au sein du système ou du produit. C’est-à-dire qu’il va s’intéresser également aux briques adjacentes qui permettent de traiter la collecte et la restitution de la donnée, ainsi que son résultat. Le code va donc s’insérer dans une architecture logicielle adaptée au traitement de la donnée.

Ainsi, la notion de traitement distribué et de parallélisme est plus que nécessaire au data scientist dans un environnement Big Data, puisque le traitement de la donnée n’est plus linéaire mais partitionné, et cela change intrinsèquement la manière de modéliser les algorithmes.

Etudes / Formation : Comment devenir data scientist ?

Habituellement, le data scientist possède au moins un master en informatique ou un diplôme d’ingénieur.
Par exemple, Cannelle, data scientist chez AViSTO, est diplômée de l'école d'ingénieur Polytech Nice-Sophia, filière mathématiques appliquées et modélisation. En dernière année, elle s’est spécialisée dans le traitement de la donnée / Big Data. Cette formation en mathématiques et informatique lui a permis de mêler les aspects théoriques et pratiques afin de mieux appréhender les problèmes complexes.

Pourquoi devient-on data scientist ?

Cannelle : « J’ai toujours eu le goût des mathématiques et quand j'ai découvert l'informatique en école d’ingénieur, cela m’a beaucoup plu aussi. J’ai donc eu envie de trouver un métier qui me permette d’exercer les deux.
Par ailleurs, j’ai toujours été intéressée par la créativité et l’innovation, je suis quelqu'un qui aime créer et apprendre : manipuler les données peut prendre de multiples formes, cela requiert de la créativité et un état d’esprit innovant. »

Profil et qualités requises du data scientist

  • Créativité, esprit d’innovation
  • Esprit d’analyse et de synthèse
  • Capacités relationnelles

Salaire d’un data scientist

Un data scientist jeune diplômé gagne un peu plus de 35K€ par an.

Évolution professionnelle

  • Chef de projet
  • Chief data scientist
  • Responsable métier
  • Avis : data scientist chez AViSTO

    Cannelle :

    « J'exerce actuellement mon métier chez un client d'AViSTO, au sein d'une entreprise qui propose une solution centralisée de gestion de la consommation et de la production énergétique dans un contexte IoT. Là-bas, j’ai la possibilité de travailler sur des technologies émergentes dans un contexte "challenging" : la donnée est typée en tant qu'évènement, ce qui implique du traitement temps réel.
    AViSTO me permet également de me tenir proche des dernières technologies utilisées, en proposant des formations comme la certification Cassandra Développeur de Datastax, ou encore en subventionnant la participation aux conférences de la technopole de Sophia Antipolis sur les innovations et nouvelles technologies, comme la Riviera Dev. Je remercie vraiment AViSTO pour tout ça, particulièrement Jean-François, mon responsable d’affaires, avec qui je m’entends très bien. »

    Pourquoi elle aime son métier de data scientist :

    « J’aime rendre la donnée brut exploitable; autrement dit, produire du concret qui puisse être compris par l’être humain. J’aime utiliser des traitements mathématiques (des algorithmes etc), ou de nouveaux frameworks de traitement de données distribuées (ex : Hadoop, ou Spark) pour transcrire la donnée.
    J’aime particulièrement le challenge du temps réel, où les algorithmes sont pensés différemment pour être plus légers et exploitables à la seconde. Cela me permet aussi de m’intéresser aux technologies de type évènements (ex : Storm, Kafka). Pour résumer, lier l’informatique et les mathématiques pour produire de la valeur, c’est ce qui me plaît vraiment. »

    Exemples de projets Big Data - Business Intelligence chez AViSTO :

    • Mise en place d’une solution de Business Intelligence « from scratch » pour exploiter les données issues des boutiques d’un grand aéroport international.
    • Mise en place d’une solution de Big Data – business intelligence permettant d’analyser les données d’utilisation du parc de véhicules électriques d’une grande entreprise.
    • Mise en place d’une solution de machine learning et Big Data pour la supervision d’un réseau de producteurs et capteurs dans le domaine de l’énergie.

    Emploi data scientist

    AViSTO recrute des data scientist ! Vous pouvez consulter nos offres ou déposer une candidature spontanée sur le site http://emploi.avisto.com/fr/all-jobs/.

    Un grand merci à Cannelle pour son aide !
    AViSTO-Ingenieure-Data-Scientist

Français