La récente démocratisation de la science des données et la...
Quels sont les avantages de recourir à des outils d’apprentissage automatique ?
La récente démocratisation de la science des données et la...
Initiation au ML : Construire un Pipeline avec BigQuery et Saagie – Partie 1
Dans cette série d’article, nous verrons comment faire du Machine...
Les avantages d’une plateforme big data open source versus les solutions propriétaires
Il est devenu impossible de parler de Data sans mentionner...
Projets « DataOps » : le guide ultime – mĂ©thode, process et techno
Sommaire Le DataOps, contraction des mots « data » et « opérations », est...
Comment analyser et modéliser des données Big Data avec Power Pivot ?
En Data Science ou en Big Data, on est amené...
Loi normale Python ou loi de Gauss, comment modélisez-vous vos données?
En Data Science et en probabilités, on est amené à ...
La mise en place de conteneurs dans le développement des...
L’analyse de données et le Big Data sont des outils...
De nouvelles technologies de stockage sont apparues au cours des...
Comment évaluer, choisir et gérer vos modèles de machine learning ?
Le machine learning (ML) est un domaine de la science...
Data science et développement informatique sont deux domaines très proches...
ETL et ELT, de quoi s’agit-il ? Quelle est la différence ?
Alors que les entreprises font de plus en plus appel...
Data Science : quel outil d’intégration continue choisir ?
L’organisation d’une équipe de Data Science est très complexe. En...
Dash : l’outil idéal pour développer une web App avec Python
Lorsque vous analysez des données, il est courant de devoir...
Le domaine de l’analyse des données est devenu un eldorado...
La conteneurisation (containerisation en anglais) consiste Ă regrouper dans une...
Les données sont la matière première de tout projet data....
Après des mois de travail passés sur un projet data...
Machine learning : comment évaluer vos modèles ? Analyses et métriques
Vous utilisez ou souhaitez utiliser le machine learning, mais vous...
La programmation fonctionnelle : un exemple concret pour comprendre comment ça marche
La programmation fonctionnelle est un paradigme de programmation peu répandu,...
10 librairies Python qui vous simplifieront la vie pour l’analyse de donnĂ©es
On peut, sans trop prendre de risque, affirmer que le...
Vous commencez un nouveau projet data et vous réfléchissez aux...
Tests unitaires, tests d’intĂ©gration… comment tester votre code ?
Vous développez, mais vous testez peu votre code ? Pourquoi et...
Les tests A/B, une étape essentielle pour valider vos modèles de machine learning
Le machine learning (ou ML) est un domaine complexe requérant méthode...
DataOps rime avec pipeline : de quoi s’agit-il et comment les mettre en place ?
89 % des entreprises auraient des difficultés à gérer leurs données...
Votre hiérarchie est sceptique ? 5 bonnes raisons de passer au DataOps
Vous connaissez le DataOps de nom, mais vous voulez en...
Le DevOps est la combinaison des termes « Dev » et « Ops ». ...
Cette semaine, Julien Fricou, Data Engineer chez Saagie, a pu...
Qu’est-ce que Spark et comment l’utiliser pour la programmation fonctionnelle ?
Spark est l’une des technologies web les plus en vue...
Bash est un interprète de commandes aussi connu en anglais...
Apache Zeppelin est un web notebook. Le concept de notebook...
Pourquoi et comment mettre en place une politique de CI/CD ?
Avec l’arrivĂ©e des nouvelles mĂ©thodes de travail comme l’Agile, le...
L’idĂ©e de cet article n’est pas de vous rappeler l’importance...
Dans le secteur de la data science, il existe des...
Si vous êtes développeur, vous savez très bien que depuis...
Grafana est un outil open source avec une licence Apache...
Qu’est-ce que Jupyter et comment faire plus avec vos notebooks ?
Si vous ĂŞtes un data scientist, il est fort probable...
Apache Nifi : gérer les flux de données en toute simplicité
De nos jours, la quantité de données que les entreprises...
Docker et la conteneurisation est l’un des sujets en tendance...
Vous êtes-vous déjà demandé comment votre téléphone pouvait comprendre ce...
Qu’est-ce que le Surapprentissage et Comment le RĂ©soudre en Machine Learning ?
Cet article vous explique le phénomène du surapprentissage (overfitting) en data...
L’organisation d’une équipe de Data Science est très complexe. En plus du...
Comment Ordonnancer Facilement des Jobs avec Apache Airflow ?
Cet article s’adresse aussi bien aux débutants qu’aux vétérans d’Airflow...
Le dilemme Robustesse vs. Adaptabilité est un problème bien connu...
La visualisation de donnĂ©es : c’est quoi et quels sont les meilleurs outils ?
Au programme de ce nouvel article, nous vous expliquons ce...
La data est devenue un enjeu pour les entreprises qui...