Vous avez entendu parler du DataOps, mais vous voulez en savoir plus sur le contrôle d’accès aux données ? Nous vous expliquons tout dans cet article.
Le DataOps, contraction des mots « data » et « opérations », est une méthodologie consistant en une gestion des données collaborative. Il est basé sur trois axes principaux :
- le développement Agile pour une gestion plus réactive du projet,
- l’amélioration de la communication pour rapprocher les différentes équipes,
- l’intégration et l’automatisation de données cohérentes et conformes.
1. DataOps : sources et types des données
Depuis une dizaine d’années, l’émergence du big data a favorisé la création et l’exploitation des données de façon exponentielle. La donnée vient aujourd’hui de sources diverses et toutes les données sont collectées et utilisées au service du business et pour aider à la prise de décision.
Les sources de données utilisées en DataOps sont très diverses. Il peut s’agir de données applicatives ou collectées grâce à l’interface web d’un site internet. Les middlewares ou les machines de production peuvent également fournir des rapports ou données pour le DataOps.
L’open source est de son côté de plus en plus utilisé dans le domaine de la data grâce aux prises de conscience sur le sujet et aux initiatives toujours plus nombreuses. Par exemple, RTE mise sur l’open source pour gérer les réseaux électriques.
Dans certaines petites ou moyennes entreprises, des données sont saisies manuellement même si cette solution doit être ponctuelle pour des raisons de productivité et de fiabilité de la donnée.
Les types de données sont divers :
- types numériques : entiers, décimaux, valeurs exactes ou approchées...,
- types alphanumériques : chaînes de caractères, chaînes binaires...,
- type temporaux : dates, heures...
2. DataOps : gestion des accès aux données
Il est fondamental de bien gérer les protocoles d’accès aux données stockées dans les entreprises pour éviter tout piratage et data leakage.
A. DataOps et data leakage
De manière involontaire, le DataOps et les projets data rendent l’exploitation de data leakage plus facile en regroupant des données fiables et exploitables. Le data leakage, ou data breach (en français « fuite de données »), est un phénomène par lequel des données d’une entreprise sont transmises à son insu à un tiers. Il peut, par exemple, s’agir de données relatives aux clients, prospects ou visiteurs, d’informations commerciales ou business et même de codes sources d’applications ou de sites web.
Toutes les entreprises sont concernées par le data leakage, surtout les sites éditeurs, les sites e-commerce et tout type de site à vocation marketing ou commerciale.
La plateforme de contenus en direct Twitch a récemment fait parler d’elle à cause d’une fuite de données massive de 3 millions de fichiers internes. Cet incident a révélé le détail des sommes versées par la plateforme de streaming vidéo à ses plus gros créateurs depuis 2019.
Un data leakage est un événement majeur pour une entreprise, car elle divulgue des informations pour la plupart confidentielles. Il peut modifier la valeur (estimée) d’une entreprise, diffuser ses innovations, qu’elles soient issues de la recherche et développement ou du fait de rachat, et porter atteinte à l’image de marque de l’entreprise. Ainsi, les hackers, à l’origine de la fuite des données de Twitch, déclarent : « Jeff Bezos a payé 970 millions de dollars pour cela, nous le donnons GRATUITEMENT ».
B. DataOps et gouvernance des données
La gouvernance des données désigne l’ensemble des processus, fonctions, règles, normes et paramètres garantissant que les données sont utilisées de manière efficace et efficiente afin de respecter les objectifs des organisations.
La gouvernance des données permet de limiter les risques de brèches dans la sécurité des systèmes informatiques, d’exploiter la richesse des données, d’optimiser les processus métier et d’augmenter la productivité. La matière première des projets DataOps étant la donnée, la gouvernance des données constitue un pilier de la réussite des projets.
C. DataOps et gestion des accès
Pour se prémunir contre le data leakage, il est important de mettre en place une gestion rigoureuse des accès aux données des projets DataOps. Donner les accès à une personne qui en a besoin n’est généralement pas un problème, car autrement, elle ne pourra pas travailler. Le sujet sera donc remonté et résolu.
La difficulté principale de la gestion des accès est la suppression de droit lorsque la personne change de service ou quitte l’entreprise. En cas de rupture ou de divorce, on pense rapidement à demander au partenaire de rendre les clés du logement, pourquoi cet automatisme n’est-il pas systématique pour les mots de passe et droits d’accès ? Pour éviter cela, il peut être intéressant de mettre en place un outil de sécurisation des identités et de contrôle d’accès qui sera lié à l’annuaire de l’entreprise pour recevoir des notifications de suppression de droit lors d’un changement de service ou d’un départ d’un collaborateur de l’entreprise.
Le DataOps possède aujourd’hui des données variées venant de sources diverses. Il est donc primordial de faire attention aux autorisations d’accès aux données en mettant en place une gouvernance des données, ceci afin de limiter le risque de data leakage, préjudiciable pour les entreprises.