L’Open Data, une mine d’or accessible à tous

L’Open Data correspond à l’ensemble des données publiées et collectées par les administrations publiques et les entreprises. Ces données sont généralement gratuites ou à très faible coût et sont facilement accessibles. L’obligation d’information et de transparence à l’égard des utilisateurs assurée par le RGPD (Règlement général sur la protection des données) fait de l’Open Data  […]

Les limitations et nouveaux challenges des Systèmes de Recommandation

Les systèmes de recommandation de produit sont omniprésents sur la toile. Instaurés par les géants du numérique (Google, Amazon, Facebook, Apple…), ils sont aujourd’hui utilisés par la plupart des marketplaces et ont vocation à augmenter la satisfaction de leurs clients tout en accroissant le chiffre d’affaires réalisé. Mais quelles en sont les limitations et quels […]

Music Tags Inspyrer, l’AI mélomane

Classification automatique du genre musical par un algorithme de Machine Learning L’Intelligence Artificielle commence à être bien connue pour ses capacités étonnantes et remarquables dans le domaine de la « vision par ordinateur » (classification d’images, reconnaissance faciale, …) ou le domaine du son avec la reconnaissance vocale. Qu’en est-il dans un domaine en apparence plus abstrait […]

Devenir Data Manager en 3 mois, c’est possible !

Data Manager

Ça y est nous sommes officiellement diplômés en Data Management ! Pendant 3 mois, nous avons suivi la formation dédiée chez DataScientest et nous avons découvert ce métier passionnant. Plutôt que de vous en donner une définition académique, nous souhaitions plutôt partager avec vous les compétences acquises durant cette formation et plus particulièrement notre projet […]

Comment faire un graphique sur Excel ?

Homme fait un graphique sur Excel

L’un des moyens les plus efficaces pour représenter des données de manière claire et compréhensible est de créer des diagrammes et des graphiques. Microsoft Excel offre aux utilisateurs de nombreuses possibilités d’analyse. Il est donc possible d’avoir plus de visibilité sur ses données numériques en créant des graphiques sur Excel. Dans les présentations, les diagrammes […]

Les enjeux liés à l’énergie électrique française à l’aide avec la Data

ejemplo_fonciones

Julien Dutour, ambassadeur chez DataScientest et alumni de notre cursus Data Analyst nous présente le projet fil rouge mené au cours de sa formation. Afin de mettre en pratique nos compétences de façon concrète, la formation Data Analyst proposée par DataScientest prévoit un projet « fil rouge » qui se déroule tout au long du […]

Coefficient de détermination : qu’est ce que c’est et comment s’en servir ?

Calculé par les logiciels de statistiques, le coefficient de détermination permet de comprendre combien de variables d’un facteur peuvent être expliquées par sa relation avec un autre facteur. Définition du coefficient de détermination Dans une régression linéaire, l’objectif est de déterminer une relation linéaire entre deux jeux de données. Lorsque l’on parle de coefficient de […]

Ansible, l’outil d’automatisation IT préféré des DevOps

Si vous êtes dans l’informatique, vous devez sûrement entendre de plus en plus parler d’Ansible. Les DSI le qualifient de « chouchou » des DevOps pour l’automatisation des tâches sur des logiciels. StackShare recense ainsi plus de 1700 entreprises qui utilisent Ansible, dont Revolut, Zalando ou encore des agences publiques telles que la NASA. Alors, qu’est-ce qu’Ansible, […]

Comment supprimer les doublons sur Excel ?

Se retrouver avec des données dupliquées sur Excel peut parfois s’avérer embêtant et même amener à des erreurs et à fausser les analyses. Mais pas de panique, trouver et supprimer ces doublons sur Excel est plutôt chose aisée. Tout d’abord, qu’est ce qu’une donnée dupliquée ? Les doublons peuvent être définis de différentes manières pour […]

Figer lignes et colonnes sur Excel : Tutoriel complet

Figer_lignes_et_colonnes_excel

Les grands ensembles de données peuvent facilement être analysés et organisés à l’aide de Microsoft Excel. Toutefois, lorsque vous travaillez avec de grandes feuilles de calcul, il est facile de perdre la trace de ce que représente chaque colonne ou chaque ligne. Pour l’analyse de données, une bonne visibilité est indispensable. Mais lorsque les feuilles […]

Les fonctions RechercheV et RechercheH

excel-recherchev-rechercheh

Comment rechercher des informations à partir d’un autre tableau ? Comment lier deux tableaux ? C’est les questions auxquelles nous allons répondre à travers cet article. Avant toute chose, il faut absolument s’assurer d’avoir une information commune entre les deux tableaux. La fonction RechercheV Notre Tableau 1 contient cette information commune : une référence, un […]

Correlation entre variables: comment mesurer la dépendance ?

correlation variables

En Data science, il est primordial de découvrir et quantifier à quel point deux variables sont liées. Ces relations peuvent être complexes et ne sont pas forcément visibles. Or certaines de ces dépendances affaiblissent les performances d’algorithme de Machine Learning comme des régressions linéaires. Il devient alors impératif de mieux préparer vos données. Découvrir nos […]