commencer machine learning python

Machine Learning & Python : Par où commencer?

3 min

Python s’est imposé en quelques années comme le langage référence pour le Machine Learning. Nombreux à vouloir commencer à programmer en Python, nous sommes tout aussi nombreux à avoir réalisé que commencer tout seul un langage informatique et assimiler les notions de Machine Learning n’est pas aisé. 

Chez DataScientest, on essaye de stimuler chaque effort d’apprentissage en fournissant toutes les astuces disponibles. 

Voici donc quelques conseils pour avancer sereinement :

Accepter de réapprendre

machine learning

Si vous décidez de vous lancer en Machine Learning et que vous avez déjà une expérience dans des langages comme Matlab ou C++ il va falloir accepter de repartir de la base et de modifier vos habitudes de code. Ce premier conseil peut paraître basique mais pour certains, avoir le sentiment de repasser par la case départ peut être assez frustrant. Il faudra donc persévérer et se documenter continuellement pour progresser. Également comme tous les langages, au début, vous ferez de nombreuses erreurs, parfois répétitives (cf. notre article dédié aux erreurs favorites des débutants en Python).

Expérimentés en code ou non vous aurez aussi peut-être du mal à vous approprier la logique, la typo de python. Cependant en persévérant au début vous arriverez assez vite à prendre en main Python. Il y a beaucoup de documentation disponible sur des forums ou divers sites spécialisés.

Rien de mieux que l’expérience

On ne le dira jamais assez mais votre maîtrise de python et des différents algorithmes d’apprentissage automatique viendra de la diversité des projets que vous allez mener. Pour progresser vite il faut étudier différentes branches d’apprentissage que ce soit du supervisé, du non supervisé, du semi supervisé ou du renforcement. Pour chacun vous ferez face à des jeux de données particuliers qui nécessitent des transformations précises. 

C’est en expérimentant que vous verrez différents cas de figure qui vous permettront de découvrir les subtilités de python et des algorithmes de Machine Learning.

Trouver des jeux de données de qualité

C’est une des difficultés quand vous vous lancez dans le Machine Learning : où trouver des jeux de données pour m’entraîner ? Vous allez parfois passer beaucoup de temps à en chercher en ligne. Cependant vous pouvez aller voir du côté de Kaggle et UCI pour trouver des jeux de données pertinents. Si vous êtes intéressés par la manipulation de données financières comme des cours de bourse vous pouvez aller voir du côté de Yahoo-finance ou encore de Quandl. Scikit-Learn met également à disposition des jeux de données dont le désormais célèbre Iris Dataset. Concernant Kaggle vous aurez la possibilité également de participer à des concours qui vous permettront de vous mesurer à d’autres Datas scientists chevronnés.

Être organisé

Pour bien avancer sans se perdre dans le vaste monde de la data science il faut savoir se fixer des étapes

  • D’abord bien comprendre les outils de base (classe, fonction, liste, opérateurs)
  • Ensuite se familiariser avec les DataFrames, très populaires dans la gestion de données
  • Terminer avec les modèles et métriques d’évaluation.
Voyez chaque étape comme une petite victoire : se fixer des objectifs régulièrement vous aidera à garder votre motivation
python machine learning

Être rigoureux et précis

Dès que vous commencez à vous lancer dans python il faudra vous astreindre à une discipline stricte quand vous codez et veiller à être attentif. Vous éviterez des erreurs de syntaxe qui peuvent vite arriver et vous faire perdre beaucoup de temps. Un bon conseil est de toujours bien organiser, aérer et surtout commenter votre code pour identifier rapidement des erreurs potentielles.

Nous vous avons donné dans cet article quelques conseils pour vous lancer dans la data science sereinement. 

Mais pour aller plus loin rien de mieux que de se former avec des professionnels comme chez Datascientest. 

Nous vous apprendrons les bases de python et vous proposerons des parcours sur mesure explorant aussi bien le Machine Learning que le Deep Learning.

N’hésitez plus, contactez-nous !