Téléchargez notre livre blanc et plongez au cœur de l'IA Générative !

logo saagie red

Stockez vos données non structurées avec l’object storage

L’une des problématiques majeures du big data est le stockage des données, car il s’agit de volumes de données considérables qu’il faut pouvoir stocker et gérer le plus facilement possible.

Une solution de stockage très utilisée à cette fin aujourd’hui est l’« object storage » (ou « stockage d’objets » en français, l’appellation reste cependant récente et on croise encore majoritairement la version anglaise).

Dans cet article, nous allons présenter cette technologie et discuter de ses particularités et de ses avantages.

Qu’est-ce que l’object storage ?

Il s’agit d’une technologie de stockage dont la particularité réside dans sa structure, ou plus précisément dans son manque de structure.

Object storage vs file storage vs block storage

On oppose souvent l’object storage à deux autres technologies, à savoir, « file storage » et « block storage ». La comparaison des trois nous aidera à mieux comprendre la spécificité de l’object storage :

Les cas d’utilisation de l’object storage

Il existe plusieurs situations dans lesquelles cette forme de stockage de données est particulièrement intéressante :

Comment choisir votre solution d’object storage ?

La plupart des fournisseurs de services cloud proposent aujourd’hui une solution d’object storage, que ce soit Google Storage, Microsoft Blob Storage, OVH, Yandex Object Storage

Le plus emblématique reste cependant Amazon S3, la solution d’object storage d’AWS et qui est aussi le premier service AWS à avoir existé. Cette ancienneté fait que l’API utilisée par Amazon S3 est devenue un standard dans l’industrie. C’est-à-dire que la majorité des fournisseurs d’object storage utilisent une API dont le schéma est similaire à celle d’Amazon S3, ce qui est très pratique pour le développement d’applications.

Différents types d’object storage disponibles

Une considération importante lorsque l’on choisit une solution d’object storage concerne le type de disponibilité souhaité.

En effet, ce paramètre peut avoir une influence importante sur le coût. Prenons exemple sur ce que propose Google Cloud Platform pour clarifier les choses. Il est possible de choisir parmi ces options :

Il faut d’abord savoir que chaque opération est facturée (chez Google ou chez les autres), par exemple, l’insertion d’un nouvel objet dans votre espace de stockage a un coût. Ce coût est très faible à l’unité, mais peut devenir significatif avec un effet d’échelle. 

L’option « standard » a le coût de Go/mois le plus élevé, en revanche, c’est l’option qui présente les tarifs les plus bas concernant l’exécution des opérations. 

À l’inverse, l’option « archive » a un tarif 5 à 10 fois plus faible de Go/mois, mais le coût des opérations est plus élevé.

L’option « archive » sera donc adaptée aux fichiers auxquels on accède rarement mais qui sont volumineux (d’où le nom d’« archive »), tandis que l’option « standard » sera adaptée aux fichiers auxquels on accède quotidiennement (par exemple, un CDN de site internet). Entre ces deux se trouvent d’autres options intermédiaires, c’est un compromis à trouver en fonction de vos besoins.

Maintenant que vous êtes incollable sur ce qu’est l’object storage, vous pouvez passer à la pratique ! Il est possible d’intégrer des technologies d’object storage dans vos projets Saagie.

 Si cette thématique du stockage vous intéresse, vous pouvez aussi consulter nos articles sur les technologies SQL et NoSQL.