Avez-vous déjà perdu patience en tentant de tracer un itinéraire de voyage ? Il est parfois difficile de concilier l’envie de ne rien rater et d’optimiser son temps de séjour en fonction des visites que l’on souhaite faire. C’est à ce challenge que Danyl et Diego, du Bootcamp Data Analyst de DataScientest ont tenté de répondre avec City Walker. Nous sommes allés à leur rencontre (à distance car 9000 km les séparent ) DataScientest : Bonjour Diego et Danyl, est- ce que vous pouvez nous raconter votre parcours respectif et ce qui vous a mené à la data science?
Danyl:
Je suis jeune diplômé de l’ESSEC Business School. Ce qui m’a attiré dans la data science c’est l’importance de ce domaine dans tous les secteurs et à tous les niveaux. Notamment les possibilités du Deep Learning qui permet de modéliser des comportements par le biais de l’apprentissage. Cette application permet de substituer certaines fonctionnalités humaines, automatisant ainsi des tâches parfois perçues comme très longues et complexes.
Diego:
Je suis Marketeur et entrepreneur. En tant que marketeur, j’ai été confronté à la problématique d’analyse de données depuis le début de mon expérience professionnelle. Je suis convaincu de la puissance des données lorsqu’on applique les bonnes techniques et c’est la raison pour laquelle j’ai fait le choix d’intégrer le parcours de Data Analyst de DataScientest.
Je suis très impressionné par le Natural Language Processing et notamment la puissance des algorithmes qui peuvent non seulement comprendre le langage humain mais aussi répondre de manière cohérente et juste.
DataScientest: Pouvez-vous résumer le projet sur lequel vous avez travaillé ?
Notre projet se nomme CityWalker. C’est le prototype d’une application proposant des itinéraires optimisés à des touristes visitant Paris. Ayant choisi la formation format bootcamp, nous avons eu un peu moins de trois mois pour mener à bien le projet.
Nous avons sélectionné ce sujet car à nos yeux il semblait être celui ouvrant nos horizons et nous permettant de sortir de notre zone de confort. Ayant des backgrounds orientés business, CityWalker possède une approche scientifique/ingénieure qui nous a permis de découvrir une nouvelle manière de penser et a également enrichi nos connaissances.
DataScientest : Quels modèles/ outils avez-vous utilisés ?
Le fonctionnement de CityWalker se base sur des modèles de classification non supervisée.Pour cela, nous avons utilisé le module Scikit-Learn de Python. Côté visualisation des données, nous avons au départ utilisé Geopandas puis nous avons effectué une seconde version optimisée avec Bokeh. Nous avons également fait appel à des algorithmes de modélisation de graphes, notamment PageRank du package NetworkX de python, afin d’optimiser les itinéraires et identifier des lieux prioritaires de visite.
DataScientest : Quelles ont été les étapes principales du projet ?
- La création du dataset
- La visualisation des données
- L’implémentation des méthodes de clustering
- L’ajout de méthode de pagerank
- L’exécution du projet sur Streamlit
DataScientest : Quel était, selon vous, le challenge de ce projet ?
Nous avons eu deux principaux défis tout au long de ce projet.
1.Tout d’abord, le facteur temps était très important à considérer car nous n’avons eu moins de trois mois pour réaliser CityWalker.
Durant cette période, il a fallu non seulement assimiler des techniques de Data Science mais également les transposer au projet en prenant en compte ses propres problématiques et besoins.
Cette contrainte fut néanmoins très stimulante car elle nous a permis de découvrir des ressources et de créer des solutions par nous-mêmes.
2. Le deuxième challenge que nous avons rencontré est la qualité du dataset. À l’origine nous avons trouvé notre dataset sur internet mais certaines variables supplémentaires auraient été nécessaire afin d’optimiser au mieux nos itinéraires et de les rendre plus intelligents. Ceci reflète l’une des principales difficultés que rencontrent les Data Analysts et Data Scientists.
DataScientest : Comment votre mentor vous a guidé au long de votre travail ?
Pierre (Responsable de cohorte de la promo Data Analyst) a été un allié important. Lorsque nous étions perdus, il a su nous indiquer la voie sans nous donner les réponses pour autant. Mais c’était à nous de parcourir le chemin. Il s’est rendu disponible sans compter son temps mais il était également exigeant sur l’effort à fournir. Nous avons beaucoup apprécié son approche.
DataScientest : Quels conseils donneriez-vous aux personnes qui souhaitent se lancer dans un projet en data science ?
Si vous désirez vous lancer dans un projet en data science, prévoyez du temps. En effet, au fur et à mesure du projet, nous avons voulu apporter des améliorations et nous avons vu certaines optimisations possibles. Il est donc important d’avoir du temps supplémentaire afin de gérer ces « imprévus » qui surviennent lorsque le projet se précise de plus en plus.
Également, il faut organiser le projet en étapes afin de ne pas se retrouver perdu(e). Il faut définir des milestones pour pouvoir se rendre compte de sa progression et ne pas perdre de vue l’objectif premier du projet.
Enfin, il est indispensable d’être curieux. Il ne faut pas hésiter à approfondir les sujets par ailleurs. Se lancer en Data Science signifie s’impliquer dans un processus d’apprentissage sans fin.
DataScientest : Quel avenir imaginez-vous à votre projet ?
Ce prototype permet dans l’état d’identifier des points à visiter en priorité. Mais cette sélection se fait uniquement sur le positionnement géographique de ces points. Il serait intéressant d’ajouter au dataset des variables pour mieux valoriser l’intérêt des lieux touristiques. Des techniques de web scraping pourraient être utilisées.
Un autre axe de développement serait de le rendre utilisable pour d’autres villes que Paris
DataScientest : le mot de la fin ?
Nous souhaitons remercier les intervenants DataScientest pour le savoir et les connaissances qu’ils nous ont transmis. Nous avons pu apprendre grâce aux modules complets et au rythme soutenu que propose le format Bootcamp. Merci également à notre mentor, Pierre, pour son temps et sa disponibilité tout au long de notre démarche.
Merci à Danyl et Diego pour leurs témoignages .
Pour retrouver le cursus Data Analyst , n’hésitez pas à consulter la page dédiée.