Nous avons vu dans un précédent article que le type de base de données peut avoir un impact profond sur les opérations que votre application peut effectuer et sur la façon dont vous conceptualisez vos données.
À travers la compréhension du théorème CAP nous allons à présent voir les fonctionnalités que votre système de gestion de base de données offre pendant le développement et l’exécution
Système distribué vs centralisé
Avant tout, il est important de comprendre la différence entre système distribué et centralisé.
La principale différence est qu’un système distribué est un réseau qui stocke des données sur plusieurs nœuds (machines physiques ou virtuelles) en même temps. Contrairement à un système centralisé qui stocke ses données dans un seul est même endroit, ce qui peut être problématique en cas de panne du système par exemple.
Théorème CAP:
Le théorème CAP nous dit qu’un système distribué ne peut fournir que deux des trois caractéristiques souhaitées : cohérence (Consistency), disponibilité (Availability) et tolérance au partitionnement (Partition Tolérance).
La cohérence signifie que tous les clients voient les mêmes données en même temps, quel que soit le nœud auquel ils se connectent.
La disponibilité signifie que tout client qui fait une requête obtient une réponse, même si un ou plusieurs nœuds sont en panne.
La tolérance au partitionnement signifie que le cluster doit continuer à fonctionner malgré un nombre quelconque de pannes de communication entre les nœuds du système.
Maintenant que nous avons étudié les différents type de bdd ainsi que le théorème CAP on peut classer les différents système de gestion de base de données en fonction de leur propriétés.
Voilà ! Vous avez à présent tous les outils nécessaires pour bien choisir votre SGBD. Vous souhaitez être formé sur les SGBD les plus utilisés dans le secteur de la data science ? Notre formation de Data Engineer est faite pour ça ! …