Microsoft Fabric : Tout savoir sur cette plateforme cloud

-
5
 m de lecture
-

Microsoft Fabric est une solution de Data Science tout-en-un sous forme de service cloud SaaS, regroupant OneLake et de nombreux outils de stockage, ingénierie et analyse de données. Découvrez tout ce que vous devez savoir sur cette plateforme qui simplifie la vie des Data Scientists, et comment la maîtriser !

Avec l’essor de l’IA et l’adoption massive de la Data Science en entreprise, les données sont devenues une ressource essentielle de la transformation numérique et un atout indispensable pour la compétitivité.

Toutefois, au fil des années, la multiplication des outils a engendré une complexité excessive. Au sein d’un grand nombre d’organisations, les Data Scientists utilisent différents logiciels pour la collecte, le stockage, l’analyse, la visualisation et l’ingénierie de données.

En particulier, les Data Lakes modernes sont devenus fragmentés et désorganisés ce qui les rend difficiles à construire, intégrer, gérer et utiliser.

Afin de répondre au besoin de solutions unifiées et simples d’utilisation, Microsoft a lancé une plateforme complète de Data Science via le Cloud : Fabric.

Qu’est-ce que Microsoft Fabric ?

Lancée en mai 2023 lors de la conférence Microsoft Build, cette plateforme analytique tout-en-un couvre tous les besoins en Data Science.Du stockage au transfert de données en passant par l’analyse en temps réel, elle regroupe une large variété de technologies et d’outils en une solution unique.

L’objectif est de mettre en place une architecture de données moderne exploitant les principes de data mesh, data fabric et data hub.

Ceci permet aux entreprises d’accéder de manière centralisée à des fonctionnalités de Data Lake, d’ingénierie et d’intégration de données et d’informatique décisionnelle.

Ce n’est pas la première fois que Microsoft rassemble plusieurs services en une seule solution. En 2015, elle avait regroupé Power Query, Power View et Power Pivot pour créer Power BI.

Très rapidement, cette plateforme s’est imposée comme une référence de la business intelligence. Avec Fabric, Microsoft tente de réitérer ce succès dans le domaine de la Data Science.

Afin de mieux comprendre les avantages de cette approche unifiée, voyons à présent quels sont les six principaux composants de la plateforme.

Source : learn.microsoft.com

OneLake : le service de stockage open-source

Les différents services de Fabric permettent d’effectuer toutes les différentes opérations de Data Science et s’adaptent donc à une large variété de cas d’usage.Tout d’abord, OneLake est la couche de stockage et le dépôt central de la plateforme. Cette architecture lakehouse permet de stocker les données au format delta lake.

Il s’agit d’un format open-source, et l’architecture de Fabric est donc également ouverte. Il est possible d’intégrer n’importe quel produit pouvant lire les données d’un delta lake.

Son data hub est la place centrale pour trouver, explorer et utiliser les actifs de données au sein de Fabric.

Une fonctionnalité très utile est la possibilité de créer des raccourcis pointant vers d’autres emplacements de données comme ADLS Gen2 ou AWS S3. Il n’est donc pas nécessaire d’effectuer de multiples copies.

Data Factory : intégration et transformation de données

La Data Factory permet de transformer les données à l’aide d’une interface glisser-déposer très intuitive.

Elle propose plus de 150 interfaces pour les sources de données sur site ou sur le cloud, et permet d’orchestrer les data pipelines. Plus de 300 options de transformation sont disponibles.

L’intelligence artificielle permet par ailleurs d’automatiser les tâches les plus communes pour gagner du temps. L’expérience est totalement personnalisable.

La suite d’outils Synapse Analytics

Les différents outils Microsoft Synapse Analytics sont incorporés à Fabric. On retrouve ainsi Synapse Data Warehouse qui est une évolution d’Azure SQL Data Warehouse.

Cette solution SaaS est entièrement gérée, et peut être utilisée avec ou sans code. Elle permet également les requêtes croisées et le scaling automatique des ressources.

De son côté, Synapse Data Engineering est un service Apache Spark pour la transformation de données. Elle s’accompagne de Runtime 1.1. qui inclut Python 3;10, Apache Spark 3.3.1 et Delta 2.2.

Avec Synapse Data Science, il est possible de construire, déployer et gérer des modèles de Machine Learning et d’IA. Les outils Notebooks et Visual Studio permettent la collaboration.

Pour l’analyse en temps réel de données provenant de sources en streaming, on peut utiliser Synapse Real-Time Analytics. Sa scalabilité est illimitée pour les utilisateurs et requêtes concurrentes, et un seul clic suffit pour créer des rapports Power BI à partir des résultats !

Notons d’ailleurs que la plateforme de Business Intelligence de Microsoft est elle aussi incorporée à Fabric et accessible directement depuis le menu principal.

Source : learn.microsoft.com

Microsoft Fabric et l’IA

L’intelligence artificielle générative est une technologie révolutionnaire sous le feu des projecteurs, et Microsoft est bien décidée à l’intégrer à tous ses outils et services.

Ainsi, Fabric permet d’exploiter Azure OpenAI Service et l’IA Copilot basée sur GPT. Les utilisateurs peuvent donc utiliser le langage conversationnel naturel pour interagir avec les outils.

Ceci permet notamment de créer des flux ou des pipelines de données, de générer du code et des fonctions entières, de construire des modèles de Machine Learning ou de visualiser les résultats des analyses.

Comment ça marche ? Expériences et Workspaces

Le fonctionnement de Microsoft Fabric repose sur deux principaux éléments : les expériences et les workspaces.

Chaque fonctionnalité est appelée expérience. Ceci inclut donc la suite Synapse, la Data Factory et Power BI.

En fonction de leurs flux de travail et de leurs cas d’usage, les utilisateurs peuvent créer des workspaces (espaces de travail) au sein desquels collaborer pour créer des rapports, des notebooks ou des lakehouses.

Quels sont les avantages de cette plateforme ?

Le principal point fort de Fabric est sa simplicité. Les utilisateurs n’ont plus besoin de se préoccuper des technologies requises pour leurs travaux d’analyse, et peuvent se concentrer sur les résultats.

En outre, l’intégration de Power BI, Azure Synapse et Data Factory dans un environnement unique offre de nombreux avantages.

Elle permet d’accéder à de nombreuses fonctionnalités d’analyse, et facilite le partage d’informations, l’accès aux données et leur réutilisation.

De plus, le Data Lake unifié laisse la liberté d’utiliser vos outils analytiques favoris tout en laissant les données au même emplacement. La gouvernance et l’administration sont également centralisées.

Source : learn.microsoft.com

Comment utiliser Microsoft Fabric ?

Pour commencer à utiliser Microsoft Fabric, rendez-vous simplement sur app.fabric.microsoft.com. Vous pouvez essayer la plateforme gratuitement pendant 60 jours, sans avoir à fournir d’informations de paiement.

Indiquez l’adresse e-mail de votre entreprise et cliquez sur le bouton permettant de commencer l’essai gratuit. Une licence Power BI est néanmoins exigée.

Après avoir créé votre compte, vous pouvez choisir parmi les différentes expériences : Data Factory, Power BI ou Synapse Data Engineering, Data Science, Data Warehouse et Real-Time Analytics.

Si vous souhaitez entraîner un modèle ML et visualiser ses prédictions, vous pouvez créer un notebook avec Synapse Data Science, entrer les données d’entraînement dans le lakehouse puis les nettoyer et les transformer avec Apache Spark.

Les modèles entraînés peuvent être enregistrés et suivis avec MLFlow, et les prédictions et résultats d’inférence sauvegardés dans le lakehouse. Enfin, vous pouvez visualiser les prédictions sur Power BI.

Autre exemple de cas d’usage : l’analyse en temps réel de données en streaming. Vous pouvez créer une base de données KQL (Kusto Query Language) et un eventstream depuis l’expérience Real Time Analytics. Là encore, un rapport Power BI permet de visualiser les résultats !

Conclusion : Microsoft Fabric, une plateforme de Data Science tout-en-un via le cloud Azure

En combinant tous les outils nécessaires aux différentes étapes de la Data Science en une seule plateforme accessible via le cloud, Microsoft Fabric permet aux professionnels de gagner du temps et d’accroître leur efficacité.

Afin d’apprendre à manier les outils du cloud Microsoft Azure et tous les meilleurs outils et techniques de science des données, vous pouvez choisir DataScientest.

Nos différentes formations permettent d’acquérir les compétences requises pour exercer les métiers de Data Analyst, Data Scientist, Data Engineer et tous les autres métiers de la Data Science.

Vous découvrirez le langage Python, les outils de bases de données, les solutions de DataViz et Business Intelligence, ou encore le Machine Learning et le Deep Learning.

Toutes nos formations s’effectuent à distance et sont éligibles au CPF pour le financement, et permettent d’obtenir un diplôme de MINES Paris Executive Education et une certification cloud AWS ou Microsoft Azure.

Nous proposons aussi des formations certifiantes entièrement dédiées à Microsoft Azure ou à la plateforme de business intelligence Power BI. Découvrez vite DataScientest !

Vous savez tout sur Microsoft Fabric. Pour plus d’informations sur le même sujet, découvrez notre dossier complet sur Microsoft Azure et notre dossier sur Power BI.

Facebook
Twitter
LinkedIn

DataScientest News

Inscrivez-vous à notre Newsletter pour recevoir nos guides, tutoriels, et les dernières actualités data directement dans votre boîte mail.

Vous souhaitez être alerté des nouveaux contenus en data science et intelligence artificielle ?

Laissez-nous votre e-mail, pour que nous puissions vous envoyer vos nouveaux articles au moment de leur publication !

Newsletter icone
icon newsletter

DataNews

Vous souhaitez recevoir notre
newsletter Data hebdomadaire ?