programmer en python

La programmation Python pour les nuls- Episode 1

4 min

La programmation vous intéresse ? Vous avez envie de découvrir les bases d’un langage de programmation couramment utilisé de manière intuitive ? Alors vous êtes au bon endroit ! À l’issue de cette lecture, vous aurez connaissance de toutes les notions de base pour programmer en Python ! Des variables aux fonctions en passant par les boucles, les outils de Python n’auront plus de secret pour vous. 

Le but de ce dossier: vous apprendre à utiliser Python pour la data science. Vous découvrirez le langage lui-même, mais apprendrez aussi à l’utiliser pour manipuler des données et pour les visualiser. 

Sans plus attendre, démarrons avec une brève introduction : découvrez les avantages de Python, les librairies les plus utilisées et les chiffres clés sur ce fameux langage. En route !

L'histoire de python

Guido Van Rossum sort les premières version de Python entre 1995 et 2000. Le langage est conçu à contrario des autres langage pour être beaucoup plus concis et expressif et nécessitant moins de temps, d’efforts et de lignes de code pour effectuer les mêmes opérations.

Le langage est très apprécié parce qu’il permet une approche plus simple des bases de la programmation. Il continuera d’évoluer au fil des années, jusqu’en décembre 2008. Cette année-là, une version plus “propre” et plus moderne du langage voit le jour : la version 3.0. Celle ci est la seule version supportée depuis janvier 2020

Aujourd’hui, Python compte plus de 8,4 millions d’utilisateurs dans le monde, ce qui  fait de lui le deuxième langage le plus utilisé derrière Javascript.

Pourquoi programmer en Python ?

Python présente de nombreux avantages

  • Librairies nombreuses: présence d’une grande collection de méthodes numériques classiques, d’outils de Plotting ou de traitement de données (data processing). Elles évitent d’avoir à reprogrammer des éléments complexes ou fastidieux, par exemple le tracé d’une courbe, une transformée de Fourier ou un algorithme d’ajustement (de fitting).
  • Facilité d’apprentissage: La syntaxe de Python est facile et le code est très lisible. Il est par exemple possible d’apprendre à dessiner des courbes en quelques minutes.
  • Efficacité: Les modules numériques Python sont efficaces sur le plan du calcul. Mais il va sans dire qu’un code très rapide devient inutile si l’on passe trop de temps à l’écrire. Python vise des temps de développement et d’exécution rapides.

Les librairies les plus utilisées en data-sciences

L’un des atouts majeurs de Python, c’est le nombre et la diversité des librairies disponibles. Beaucoup sont utilisées pour la Data Science  Parmi elles, les plus populaires sont :

  • La librairie Pandas dédiée au travail sur les tableaux de données aussi appelés « dataframes ». Elle permet à la fois la manipulation et l’analyse des données.
  •  La librairie Numpy dédiée au calcul numérique. Elle facilite la manipulation des tableaux numériques en permettant notamment d’y appliquer des fonctions de calcul diverses.
  • La librairie Scikit-learn dédiée au machine learning. Elle permet entre autres d’implémenter des méthodes pour la préparation des données mais aussi pour la modélisation.
  • La librairie Tensorflow est une librairie dédiée au machine learning et plus particulièrement au Deep Learning. Elle a été créée en open source par l’équipe Intelligence Artificielle de chez Google.

Trêve de bavardages, passons à la pratique

Démarrons l’apprentissage avec les différents types de variables en Python. Ce n’est que le début mais d’ici quelques semaines, vous aurez toutes les bases pour programmer en Python 

Variables

Une variable est utilisée pour stocker les données qui seront utilisées par le programme. Elle peut stocker un nombre, une chaîne de caractères, un booléen, une liste ou tout autre type de données.

Chaque variable a un nom et le signe égal = est utilisé pour attribuer une valeur à une variable. Après l’attribution initiale, la valeur d’une variable peut être mise à jour à de nouvelles valeurs selon les besoins.

Types de base

Nous allons à présent voir les types de données utilisées en python.

Types numériques

Python supporte à la fois les nombres entiers et les nombres à virgule flottante. Il n’y a pas de déclaration de type pour les distinguer; Python les distingue par la présence ou l’absence d’un point décimal.

Les chaînes de caractères (Strings):

Afin de stocker des données textuelles, on utilise les chaînes de caractères qui peuvent être instancié grace a différentes syntaxes. (guillemets simples, doubles ou triples)

Une chaîne est un objet immuable et il n’est pas possible de modifier son contenu. On peut cependant créer de nouvelles chaînes à partir de la chaîne originale.

Les booléens:

Les booléens sont le résultat d’opérations logiques et ont deux valeurs possibles : True ou False.
Voici la liste des operations qui s’applique au booléens:
OpérationRésultat
X or YSi X est faux, alors Y sinon X
X And YSi X est faux, alors X, sinon Y
Not XSi X est faux, alors true sinon false

Les conteneurs:

Python fournit de nombreux types de conteneurs efficaces, dans lesquels des collections d’objets peuvent être stockées.
Nous allons étudier les principaux conteneurs à savoir les listes, les tuples, les sets et les dictionnaires (mais il en existe beaucoup d’autres…)

1- Listes:

Une liste est une collection ordonnée d’objets. Ces objets peuvent avoir différents types.

2- Tuple:

Les tuples sont des listes immuables.

3- Set:

Un set est un conteneur non ordonné d’éléments uniques

4- Dictionnaire:

Un dictionnaire est en fait un tableau efficace qui met en correspondance les clés avec les valeurs. C’est le conteneur le plus important en Python.

Remarques importantes

  • Les clés peuvent être de différents types
  • Une clé doit être de type immuable

Opérations gérées par les dictionnaires:

Conclusion

Nous avons donc vu dans ce premier article les bases de la programmation python à travers l’instanciation et l’utilisation de variables de différents types et les opérations basiques réalisables sur celle-ci.

Rendez vous la semaine prochaine pour un nouveau volet pour poursuivre sur les instructions. Nous verrons également les fonctions et comment charger un jeu de données ! D’ici là et si l’attente est intenable, nos parcours Data AnalystData Scientist et Data Engineer sont le parfait endroit pour démarrer et approfondir votre apprentissage en Data Science !