Refactoring de code ou de base de données : tout savoir
Le refactoring de code est une technique couramment utilisée en programmation informatique, et notamment pour le Data Engineering. Elle consiste à restructurer le code informatique
Le refactoring de code est une technique couramment utilisée en programmation informatique, et notamment pour le Data Engineering. Elle consiste à restructurer le code informatique
La définition du bon modèle est primordiale pour réaliser des prédictions pertinentes en Machine Learning. Mais un mauvais ajustement des données d’apprentissage peut affecter la
Les diagrammes en pie chart (plus communément appelés « camembert » dans la langue de Molière) font certainement partie des types de graphiques les plus connus. Ils
Pour définir un modèle prédictif, les datas scientists font appel à de multiples observations. Mais si l’étude de ces observations permet d’aboutir à un résultat
Si les données représentent une ressource précieuse pour les entreprises, la perte de datas peut aussi avoir des conséquences désastreuses. Alors pour éviter cette situation,
Avec le développement de la culture DevOps, de nouveaux concepts émergent. C’est notamment le cas du déploiement bleu/vert qui est pleinement associé à cette philosophie
Dataiku est une plateforme unifiée de Data Science, open source et basée sur le cloud. Elle offre des fonctionnalités de préparation de données, d’analyse et
En python, les boucles s’utilisent pour répéter plusieurs fois l’exécution d’une partie d’un programme. Il existe deux types de boucles : Lorsqu’on sait à l’avance
Qu’est ce que le web scraping ? En tant que Data Scientist, Data Engineer ou Data Analyst vous êtes amené à manipuler des jeux de
Le Data Wrangling consiste à préparer les données pour pouvoir les analyser. Ce processus est une étape incontournable de la Data Science, et requiert des
Découvrez les différentes fonctionnalités de Dataiku, pour saisir tout le potentiel du Data Science Studio. À travers ce dossier, vous comprendrez pourquoi cette plateforme est
Le Data Drift ou dérive de donnée survient quand les données sur lequel s’exécute le modèle diffèrent de façon trop importantes des données d’entraînement. Ce
La certification qualité a été délivrée au titre des catégories d’actions suivantes :
- Actions de formation
- Actions de formation par apprentissage