Un Data Hoarder conserve de nombreuses données électroniques superflues et obsolètes. Il peut s’agir d’un individu ou d’une organisation. Découvrez tout ce que vous devez savoir sur cette pratique, et ses dangers en matière de cybersécurité pour les entreprises !
Depuis toujours, de nombreuses personnes accumulent des objets de façon compulsive. Malgré l’encombrement de leur espace de vie, elles ne parviennent pas à jeter ce dont elles n’ont plus besoin.
À l’ère du numérique, ce comportement est reproduit par les individus et les organisations qui conservent inutilement un large volume de données : les Data Hoarders.
Qu’est-ce que le Data Hoarding ?
Le Data Hoarding consiste à archiver ou à ne jamais supprimer les données électroniques, même si elles n’ont strictement aucune utilité.
Contrairement à l’accumulation d’objets physiques qui prend de la place, le Data Hoarding peut passer inaperçu puisque les données sont invisibles.
Toutefois, cette pratique peut très rapidement poser problème. Elle peut atténuer la qualité de vie d’un individu, ou même impacter le fonctionnement d’une entreprise.
Qu’est-ce qu’un Data Hoarder ?
À l’échelle individuelle, le Data Hoarding est l’attitude d’une personne qui collecte des fichiers d’une manière obsessive.
Dans les cas les plus extrêmes, elle peut se sentir anxieuse ou effrayée à l’idée de supprimer des données.
Outre le stockage, un Data Hoarder tient à maintenir l’accès à ses données depuis n’importe où et pour toujours.
Sur le forum Reddit, il existe un espace spécialement dédié à cette pratique depuis 2013 : /r/DataHoarder/. Cette communauté rassemble plus de 554 000 membres.
Leurs motivations sont diverses. Il peut notamment s’agir de conserver leur série télévisée préférée sur un disque dur au cas où elle serait soudainement censurée ou annulée à cause d’un problème juridique.
Quelles que soient leurs raisons, les Data Hoarders ont pour point commun leur refus catégorique de supprimer des données définitivement. Un comportement qui peut s’apparenter à un trouble psychologique dans les cas les plus extrêmes.
Le Data Hoarding à l’échelle d’une entreprise
Au-delà d’une lubie personnelle, le Data Hoarding peut aussi être une pratique adoptée à l’échelle de toute une organisation.
Ceci concerne les entreprises qui collectent et conservent de très larges quantités de données inutiles, et se refusent à les supprimer. Il peut s’agir de vieux emails, d’images, ou encore de correspondances entre employés.
Or, cette agglutination de données peut avoir des effets néfastes. Elle peut rendre l’organisation moins efficace, et générer des risques pour les données de l’entreprise ou de ses clients.
Par exemple, les données non utilisées (Dark Data) non utilisées et stockées en grande quantité peuvent aggraver une faille de sécurité.
De plus, le Data Hoarding va à l’encontre des lois sur la protection des données comme le RGPD de l’UE. Ce règlement fixe une limite de temps à ne pas dépasser pour le stockage d’informations.
Pourtant, contrairement à ce qu’on pourrait croire, cette mauvaise habitude est loin d’être marginale. Selon une étude menée par Veritas Data Genomics,83% des décideurs IT estiment que leur entreprise est Data Hoarder.
Bien souvent, la cause est le manque de volonté des employés pour supprimer les fichiers obsolètes. Cette tâche s’apparente pour beaucoup à une corvée ménagère.
À l’heure où le stockage de données semble illimité grâce au cloud, les organisations stockent de vastes volumes de données anciennes et redondantes. Pourtant, les conséquences peuvent être graves.
Pourquoi le Data Hoarding pose problème ?
De prime abord, le Data Hoarding peut sembler inoffensif. Il peut même s’agir d’une pratique utile pour préserver la culture et la diffuser, dans le cas d’une numérisation de films ou de musiques.
Toutefois, l’accumulation de données peut devenir très problématique aussi bien à l’échelle individuelle que pour une organisation.
Vous devez commencer à vous méfier si vous conservez davantage de fichiers que ce que vous pouvez gérer. Si votre ordinateur commence à ralentir, cela traduit aussi un excès de données.
En outre, si vous retrouvez des fichiers qui n’ont aucun intérêt en parcourant votre disque dur, il est probablement temps d’entamer un grand ménage.
L’excès de fichiers obsolètes peut impacter négativement la sécurité des données. Ils peuvent contenir des données sensibles qui risquent d’être piratées ou volées.
C’est aussi un frein pour la flexibilité et l’efficacité de l’entreprise. Les fichiers redondants encombrent les bases de données et rendent les informations utiles plus difficiles à trouver.
Acheter davantage de capacité de stockage sur le cloud est très facile, mais les coûts peuvent rapidement s’additionner. Au total, les entreprises dépensent plus de 60 milliards de dollars par an en stockage cloud inutile selon une étude de Business Insider.
De manière générale, le Data Hoarding peut vous coûter du temps et de l’énergie. Il est donc préférable de ne garder que le strict nécessaire pour pouvoir rester concentré.
Par ailleurs, cette pratique peut même s’avérer illégale dans certains cas. Le RGPD de l’UE impose notamment la suppression des données personnelles au bout de 3 ans.
Les entreprises ne respectant pas cette règle s’exposent à une amende colossale, pouvant atteindre 4% de leur chiffre d’affaires annuel. En cas de fuite de données, une organisation devra aussi regagner la confiance de ses clients.
De même, aux États-Unis, la protection des droits d’auteur perdure pendant 70 ans après le décès d’un auteur. Il est donc illégal de conserver ce contenu au format numérique sur le cloud, et le fournisseur peut décider de le supprimer du jour au lendemain sans préavis.
Comment lutter contre le Data Hoarding ?
Afin de résoudre le problème, un grand nombre d’organisations décident d’employer un Chief Data Officer (directeur des données) ou un Data Strategist pour définir une stratégie visant à ne conserver que les données pertinentes.
Celui-ci peut instaurer une culture d’entreprise autour de la sécurité des données et des meilleures pratiques de stockage.
Il convient aussi de rappeler régulièrement aux utilisateurs du réseau de ne pas sauvegarder leurs données personnelles telles que leurs photos et emails sur le cloud.
Un grand « ménage de printemps » peut être organisé au sein d’une entreprise plusieurs fois par an. Les employés auront alors pour tâche de supprimer manuellement les fichiers anciens et redondants.
Ce processus peut aussi être automatisé par les équipes IT afin de purger automatiquement les vieilles données après une période de temps.
Notons que certains fournisseurs de cloud proposent des outils de surveillance permettant d’évaluer la quantité de données utilisées et à quelle fréquence les fichiers sont ouverts par les utilisateurs. Ceci peut aider à choisir les fichiers à effacer.
Que vous soyez à la maison ou au travail, vous pouvez éviter les désagréments en prenant l’habitude de passer 5 minutes par jour à supprimer les fichiers dont vous n’avez plus besoin.
Si vous n’arrivez pas à distinguer les fichiers dont vous avez encore besoin, vous pouvez décider de supprimer tous ceux que vous n’avez pas ouverts depuis au moins un an.
Bien entendu, cela ne concerna pas les documents que vous devez obligatoirement garder pour raisons légales.
Conclusion : le Data Hoarder, un fléau pour la sécurité des données
Le Data Hoarding peut causer de graves soucis s’il prend l’ampleur d’une névrose à l’échelle individuelle, ou s’il empêche la mise en conformité au RGPD au sein d’une organisation.
Il est donc essentiel de corriger l’attitude des Data Hoarders avant qu’il ne soit trop tard. Ceci peut passer par une formation aux bonnes pratiques de gestion des données, ou par le recrutement d’un Data Strategist ou d’un directeur des données chargé de définir la politique de l’entreprise.
Afin d’apprendre à maîtriser les meilleures techniques et outils de gestion, traitement et stockage de données, vous pouvez choisir DataScientest.
Nos différentes formations vous permettent d’acquérir toutes les compétences requises pour exercer les métiers de Data Analyst, Data Engineer, Data Scientist, Machine Learning Engineer ou encore Data Product Manager.
Vous apprendrez notamment à manier Python, les bases de données, les outils d’analyse, les solutions de DataViz ou encore les logiciels de Business Intelligence.
Toutes nos formations s’effectuent entièrement à distance, et sont éligibles au CPF pour le financement. À la fin du cursus, vous pourrez recevoir une certification délivrée par MINES ParisTech PSL Education. Découvrez vite DataScientest !
Vous savez tout sur les Data Hoarders. Pour plus d’informations sur le même sujet, découvrez notre dossier complet sur le Data Management et notre guide sur le métier de Data Strategist.