Comment amener un projet data en production ?
Les chiffres parlent d’eux-mĂŞmes : selon une Ă©tude de Forrester Consulting, plus de 60 % des projets de transformation numĂ©rique en entreprise Ă©chouent. La notion de risque est inhĂ©rente aux projets data. Pour rĂ©duire ce risque, optez pour une approche orientĂ©e production. Pour cela, retenez un seul mot : le DataOps. Les dĂ©fis sont multiples en big data (le POC, le […]
Comment créer un pipeline de détection de sentiments sur Saagie avec Python, Bash, AWS Glue, VSCode, MLflow et Dash
Pour accompagner nos nouveaux utilisateurs dans leurs premiers pas sur Saagie, nos Ă©quipes ont dĂ©veloppĂ© un projet complet de dĂ©tection de sentiments exprimĂ©s au sein de critiques de films. Celui-ci repose sur une interaction forte entre des jobs en Python, Bash, AWS Glue et des applications Docker comme VSCode, MLflow et Dash pour dĂ©montrer comment […]
Isoler ses environnements de développements par projet et assurer la reproductibilité des jobs : un must do pour vos projets data
Cet article fait partie d’une sĂ©rie d’articles sur les bonnes pratiques Ă destination du Data Engineer. Une version synthĂ©tique de cette sĂ©rie a Ă©tĂ© prĂ©sentĂ©e lors d’un webinar que vous pourrez retrouver ici ! Vous trouverez les autres articles de cette sĂ©rie ici et lĂ : Le monitoring : la clĂ© pour superviser vos projets […]
Pourquoi et comment mettre en place une politique de CI/CD ?
Avec l’arrivĂ©e des nouvelles mĂ©thodes de travail comme l’Agile, le DevOps et maintenant le DataOps, les mises en production sont devenues beaucoup plus frĂ©quentes. Ces nouvelles pratiques amènent toutes un lot d’avantages : flexibilitĂ©, efficacitĂ© des Ă©quipes, qualitĂ© des livraisons ; mais Ă©galement leur lot de problĂ©matiques auxquelles il faut rĂ©pondre en optant pour des […]
Le monitoring : la clé pour superviser vos projets data
L’idĂ©e de cet article n’est pas de vous rappeler l’importance de bien monitorer ses systèmes et applications IT, il y a plĂ©thores d’articles en ligne qui le font mieux que nous. Nous prĂ©fĂ©rerons ici Ă©voquer les spĂ©cificitĂ©s des projets strictement orientĂ©s autour de la donnĂ©e (analytics, machine learning, streaming) et vous donner des exemples concrets […]
DataOps : le DevOps Appliqué aux Projets Data ?
Seuls 50% des projets d’Intelligence Artificielle ont aujourd’hui Ă©tĂ© dĂ©ployĂ©s. C’est ce qu’il faut tirer des diffĂ©rentes Ă©tudes de Gartner, Capgemini ou encore BCG : le besoin d’industrialiser. Ce qui est mis en cause dans les diffĂ©rents rapports, c’est une durĂ©e moyenne de dĂ©ploiement de 12 Ă 18 mois, qui mène Ă un changement d’outil […]
Comment Passer de la Business Intelligence au Machine Learning ?
Depuis les 2 dernières annĂ©es, le monde professionnel regarde avec un grande attention tout ce qui concerne l’Intelligence Artificielle (IA) et le Big Data. Les entreprises ont maintenant compris tout ce que pouvaient leur apporter ces technologies, mais la majoritĂ© d’entre elles s’imagine tout de suite concevoir des applications mĂ©tiers intĂ©grant des algorithmes prĂ©dictifs dĂ©veloppĂ©s par […]
La Data Fabric pour concrétiser vos projets Big Data et IA !
Big Data, Data Science, intelligence artificielle… Si ces termes gagnent chaque jour en popularitĂ©, peu d’initiatives voient en rĂ©alitĂ© le jour. De nombreuses entreprises ont des projets et cas d’usage Ă adresser, mais encore faut-il pouvoir les mettre en production. La Data Fabric apparaĂ®t alors comme une solution prometteuse. C’est un concept qui a Ă©mergĂ© outre atlantique ces […]