Google Cloud a dévoilé des modèles de requête pour ses data clean rooms BigQuery, permettant aux organisations de partager des enseignements sur des données sensibles sans exposer les informations brutes. Cette nouvelle fonctionnalité permet aux propriétaires de données de créer des requêtes prédéfinies et réutilisables que les partenaires peuvent exécuter avec des paramètres contrôlés, ne retournant que des résultats agrégés tout en empêchant l’accès direct aux données ou leur fuite.
La technologie répond à un défi crucial de la collaboration sur les données en entreprise, où les entreprises doivent partager des enseignements analytiques avec des partenaires tout en protégeant les informations propriétaires. Construits sur les fonctions de table (TVF) de BigQuery, les modèles fonctionnent comme des requêtes fixes et réutilisables qui s’exécutent au sein d’environnements de data clean room contrôlés, selon l’annonce de Google Cloud.
Dans ce système, les propriétaires de données conservent un contrôle total sur la manière dont leurs informations sont consultées. Les partenaires ne peuvent exécuter que des analyses préalablement approuvées avec des paramètres d’entrée spécifiques, tandis que la logique de requête sous-jacente reste masquée. Cette architecture garantit que la propriété intellectuelle intégrée aux méthodes analytiques reste protégée, au même titre que les données brutes elles-mêmes.
Les améliorations de sécurité vont au-delà du simple contrôle d’accès. Les organisations peuvent désormais appliquer des politiques de gouvernance cohérentes à l’ensemble des analyses de données, ce qui facilite la conformité aux réglementations en matière de confidentialité tout en réduisant considérablement le risque de violations de données ou de divulgations involontaires. Lorsque plusieurs parties contribuent des données à une data clean room, tout modèle de requête qui fait référence aux informations d’une autre partie nécessite une approbation explicite de ce propriétaire de données avant son activation.
Google Cloud a décrit deux principaux modèles de déploiement pour cette fonctionnalité. Dans le partage unidirectionnel, un fournisseur de données crée un ensemble de modèles de requête approuvés que les partenaires peuvent exécuter pour des analyses spécifiques. Le modèle de partage collaboratif permet aux participants de la clean room de proposer des requêtes qui croisent des données entre plusieurs organisations, bien que les contributeurs ne puissent consulter que les schémas de métadonnées, et non les données réelles, lors de la création de ces propositions.
La fonctionnalité s’attaque également à un obstacle pratique à la collaboration sur les données : le manque d’expertise technique. Les fournisseurs de données peuvent créer des modèles faciles à utiliser pour des partenaires qui peuvent manquer d’expérience pour écrire des requêtes SQL complexes et respectueuses de la confidentialité, démocratisant ainsi l’accès à des capacités d’analyse de données sécurisées.
Actuellement, le système prend en charge les opérations SQL standard, y compris les commandes SELECT, FROM, WHERE et JOIN au sein des fonctions de table. Une limitation notable est que chaque modèle de requête ne peut référencer plusieurs tables que si elles appartiennent au même propriétaire de données, empêchant ainsi des combinaisons de données non autorisées entre les parties.
Cette annonce représente la dernière initiative de Google Cloud pour gagner des parts de marché dans le secteur en forte croissance des data clean rooms, où les entreprises recherchent des méthodes sécurisées pour partager des informations sans compromettre leurs avantages concurrentiels ni enfreindre les réglementations sur la confidentialité.