Mardi 15 Décembre 2020, nous avons eu la chance d’organiser un webinar sur la thématique de la Data Factory avec Arnold Haine, CTO de BVA Group, et Barthélémy Longueville, expert des enjeux data dans le secteur de l’industrie, fondateur de Tolmay. Si vous n’avez pas pu y assister, voici ce qu’il faut retenir !
Quelques chiffres pour commencer
Tout d’abord, Gartner a montré dans son rapport d’Octobre 2020 que les dépenses en infrastructure IT ont baissé de 6% en 2020. Cela s’explique notamment par l’adoption du DataOps au sein d’un nombre croissant d’organisations. Deuxième élément notable à retenir : le marché Big Data en 2021 atteindrait les 67 milliards de dollars, représentant ainsi plus du double du marché actuel (28,7 milliards). Les deux postes de dépenses concerneront majoritairement les services managés ainsi que les outils d’analyse.
Conclusion, la Data Factory prendra très certainement une place de plus en plus essentielle dans l’organisation des entreprises qui y voient un réel potentiel de valeur ajoutée.
Data Factory : hub intégré de mise à disposition de l'ensemble des technologies permettant de manipuler la data : des outils l'ETL aux outils d'analyse et d'exploration de données à leur exposition finale (API, dataviz, application métier, ...)
C’est au sein de cette Data Factory (ou Data Office) que nous allons trouver les profils IT Ops, Data Engineers et Data Scientists qui permettront de créer de la valeur business grâce au DataOps (notion que vous connaissez sur le bout des doigts!).
Retour d'expérience avec BVA Group
Si vous ne connaissez pas encore le groupe BVA, c’est un cabinet d’études, expert en sciences comportementales mettant ainsi la data science au cœur de son métier. Au cours des dix dernières années, l’innovation a joué un rôle essentiel dans le développement de l’entreprise.
Pour BVA Group, l’adoption du DataOps fut un succès pour plusieurs raisons :
- En adoptant Saagie, BVA a donc pu centraliser les données dans un data lake et construire des pipelines de données scalables et monitorées.
- L’organisation a également permis aux Data Engineers et Data Scientists de se concentrer pleinement sur leurs missions et non plus sur la préparation des données en automatisant certaines tâches.
Les enjeux concernent désormais la catégorisation des données stockées sur le data lake pour une meilleure lecture, l’adoption de Saagie par toutes les entités BVA et enfin développer des offres de services et produits Data.
Les enjeux data dans le secteur industriel
Quelles sont les problématiques auxquelles font face les groupes industriels ?
La vraie vague de données qui arrive, ce ne sont pas les données personnelles, mais les données industrielles. [...] Nous avons, en Europe, les technologies pour être les leaders des données industrielles.
Thierry breton - France Inter, 14/12/2020
Nous sommes tous conscients du fait qu’il y a eu une grande vague de données personnelles sur laquelle se sont positionnées les entreprises américaines en termes de génération de valeur. La deuxième vague qui arrive concerne les données industrielles et l’Europe est très bien positionnée sur ces technologies, et il y a donc une réelle opportunité technologique sur le secteur de l’industrie qui est pourtant très concurrentiel.
La data est un levier pour tirer de la valeur. Il s’agit donc dans un premier temps de savoir comment convertir ces technologies et ces opportunités d’usage de la data en cas d’usage en production, c’est-à-dire qui soient réellement utilisés dans les usines, par les équipes. Et dans un second temps, générer de la valeur rapidement.
Un site industriel est composé de personnes et de machines physiques. Il faut donc y intégrer la donnée au sein des métiers existants de l’industrie (qualité, processus). Il y a donc une hybridation des technologies avec les compétences techniques et intellectuelles des collaborateurs.
Il faut faire évoluer les compétences des équipes industrielles vers un mode de pensée tourné vers la data. Force est de constater que les technologies peuvent également leur permettre de faciliter, automatiser, augmenter certaines tâches qui leur incombent.
Quelles solutions ?
Data Office : cette organisation doit être mise en place pour accompagner dans la transformation numérique, en cohérence avec la stratégie de l’entreprise, pour aller chercher les cas d’usage, communiquer auprès des équipes, et gérer le portefeuille de projets pour atteindre l’industrialisation le plus vite possible.
DataOps hybride : il faut mettre en place une usine d’assemblage data qui soit aussi robuste que l’usine de création d’équipements industriels. Les métiers et les professionnels data doivent donc travailler en étroite collaboration afin de tester en permanence la qualité des modèles.
Compétences : il faut créer des liens entre les équipes data et les équipes industrielles.
Quelles sont les tendances dans le secteur de l'industrie dans les prochaines années ?
- Âge d’or du DataOps, du DevOps et de l’Infra as Code : tout ce qui va permettre de faciliter et de lancer les ressources nécessaires pour bâtir les modèles, développer les pipelines, faciliter l’apprentissage, va se développer de manière accrue.
- Démocratisation des outils data : génération du autoML, low code et étiquetage assisté
- Nouveaux types de collaboration hommes / algorithmes