Correlation entre variables: comment mesurer la dépendance ?
En Data science, il est primordial de découvrir et quantifier à quel point deux variables sont liées. Ces relations peuvent être complexes et ne sont pas forcément visibles. Or certaines…
Le Machine Learning, ou apprentissage automatique, est l’utilisation d’algorithmes permettant à des programmes informatiques de s’améliorer automatiquement par le biais de l’expérience. En d’autres termes, ces algorithmes permettent à un ordinateur d’apprendre à la manière d’un être humain.
Pour apprendre, un système de Machine Learning est ” nourri ” à l’aide de nombreuses données sur lesquelles il pourra s’entraîner. Par exemple, un algorithme de Machine Learning peut-être nourri à l’aide de centaines de photos de chat afin d’apprendre à reconnaître les chats dans n’importe quel contexte.
Pour y parvenir, le système passe en revue les photos qui lui sont fournies en exemple afin de discerner des ” patterns ” (motifs réguliers) de pixels ou de couleurs. Par la suite, il s’appuiera sur ces analyses pour déterminer (prédire) si une nouvelle image représente bien un chat.
S’il échoue, le système s’ajustera et choisira peut-être d’autres patterns sur lesquelles appuyer ses prédictions. Il s’entraînera ainsi et apprendra de ses erreurs jusqu’à être capable d’identifier correctement un chat avec une précision maximale.
Il s’agit d’un simple exemple permettant de comprendre facilement le concept du Machine Learning. Cependant, ces algorithmes sont aujourd’hui utilisés pour une vaste variété d’applications dans tous les secteurs.
L’apprentissage automatique offre de nombreuses possibilités, et permet notamment de résoudre des problèmes très compliqués. On l’utilise notamment pour l’analyse d’imagerie médicale, pour les assistants numériques, la détection de fraude, la cybersécurité ou encore les voitures autonomes. Il s’agit en réalité d’une véritable révolution industrielle.
On désigne souvent le Machine Learning comme une sous-catégorie d’intelligence artificielle. En réalité, il s’agit davantage d’un domaine scientifique à part entière regroupant des technologies, des méthodes et des concepts.
De manière générale, le Machine Learning exploite diverses techniques pour traiter de larges volumes de données et s’appuyer sur les résultats pour prendre des décisions ou effectuer des prédictions.
En Data science, il est primordial de découvrir et quantifier à quel point deux variables sont liées. Ces relations peuvent être complexes et ne sont pas forcément visibles. Or certaines…
Le clustering est une discipline particulière du Machine Learning ayant pour objectif de séparer vos données en groupes homogènes ayant des caractéristiques communes. C’est un domaine très apprécié en marketing,…
Comment gérer les problèmes de Classification déséquilibrée Partie II Les méthodes pour lutter contre le déséquilibre des données Après avoir détaillé les différents problèmes liés au déséquilibre des données et…
Comment gérer les problèmes de Classification déséquilibrée ? Partie I La classification sur données déséquilibrées est un problème de classification où l'échantillon d'apprentissage contient une forte disparité entre les classes…
Numériser des variables Ça y est ! Le jeu de données est nettoyé! Plus de valeurs manquantes, les choix de modélisation ont été faits ! On…
XGBoost signifie eXtreme Gradient Boosting. Codé en C++, il est disponible dans à peu près tous les langages de programmations utiles en Machine Learning. Quels sont ses atouts ? Pourquoi remporte t-il si régulièrement les compétitions Kaggle ?