Skip to Content

Avantatges de l’emmagatzematge distribuït

Ens trobem immersos en plena era digital on la informació ha passat a ser part fonamental perquè les empreses puguin assolir els seus objectius. La demanda d’emmagatzematge cada vegada és més gran per poder guardar fotos, vídeos, documents i una altra classe d’arxius de dades. La generació d’informació per part de persones, empreses, entitats i dispositius intel·ligents té una tendència creixent i els sistemes d’emmagatzematge tradicionals no poden fer front a aquesta contínua demanda.

Cal recórrer a un altre tipus de solucions com és l’emmagatzematge distribuït, un nou concepte que s’adapta a aquesta creixent necessitat de recursos d’emmagatzematge escalables i flexibles.

Què és l’emmagatzematge distribuït i per què és tan important

S’anomena emmagatzematge distribuït a l’ús d’una xarxa informàtica per emmagatzemar dades, on aquests es guarden en més d’un node o servidor. Aquest sistema permet una major flexibilitat, i un millor rendiment a l’hora de gestionar i accedir a les dades seleccionades, al mateix temps que incrementa la seguretat de la informació.

Les principals característiques d’aquest sistema d’emmagatzematge de dades són:

  • Flexible i Escalable. L’emmagatzematge distribuït s’adapta a les necessitats en cada moment, podent incrementar de forma ràpida i senzilla la capacitat d’emmagatzematge, sempre que les circumstàncies ho demanin. La seva capacitat d’escalar horitzontalment permet crear un sistema d’emmagatzematge compartit format per nombrosos nodes.
  • Segur. La informació i l’accés a aquesta, està assegurada en comptar amb múltiples servidors replicats, de manera que si es cau, un altre passarà de forma immediata a ocupar el seu lloc, sense pèrdua de dades i mantenint l’accés a aquests.
  • Ràpid i eficient. Aquest tipus d’emmagatzematge permet una gestió àgil de la informació amb accés ràpid per a consultes, canvis, pujada de dades, etc. L’emmagatzematge distribuït pot aconseguir un gran rendiment amb uns baixos requisits de hardware en treure el màxim partit de tots els recursos dels servidors.

En què es diferencia dels sistemes tradicionals (SAN & NAS)

Els sistemes distribuïts es diferencien de sistemes tradicionals d’emmagatzematge com SAN (xarxa d’àrea d’emmagatzematge) o NAS (emmagatzematge connectat a xarxa) que es basen principalment en el hardware, en una definició d’emmagatzematge per software.

Amb els sistemes SAN i NAS cal realitzar una inversió inicial en hardware mentre que en els sistemes d’emmagatzematge distribuït s’utilitzen els servidors, unitats i xarxa estàndard, minimitzant el cost en infraestructura.

Els sistemes tradicionals d’emmagatzematge es poden escalar fins a un límit (com per exemple, el nombre de discs que es poden afegir a un NAS), mentre que en un sistema distribuït pràcticament no té límits per expandir la capacitat (amb un disseny cloud, s’afegeixen nous nodes i el clúster augmenta).

Al contrari que els sistemes NAS i SAN, en un sistema d’emmagatzematge distribuït per software es garanteix que les dades estiguin dividides i replicades, incrementant la integritat de la informació i les opcions de recuperació davant de qualsevol problema.

Avantatges de l’emmagatzematge distribuït

Els principals beneficis que aporta l’emmagatzematge distribuït són:

  • Flexibilitat i escalabilitat. Aquest sistema d’emmagatzematge permet que un servidor estàndard executi emmagatzematge entre un altre tipus d’aplicacions, podent afegir més servidors per augmentar la capacitat d’emmagatzematge de forma lineal. Es tracta d’un sistema dissenyat per tolerar falles, on qualsevol incident no és d’emergència, ja que pot ser solucionat de forma automatitzada.
  • Major rendiment. En sistema d’emmagatzematge distribuït qualsevol servidor disposa de la seva pròpia CPU, memòria i interfície de xarxa, comportant-se com un grup. Cada vegada que s’afegeix un nou servidor el conjunt total de recursos augmenta, millorant la velocitat i el rendiment.
  • Menor cost. Aquest tipus de sistemes uneix l’emmagatzematge amb la computació incrementant l’ús dels servidors, el que repercuteix en una disminució de cost dels centres de dades en aspectes com l’energia consumida, refrigeració o espai necessari, entre d’altres.
  • Ofereix tres tipus d’emmagatzematge distribuït. Es tracta d’un sistema unificat que ofereix emmagatzematge per blocs, per fitxers i per objectes.

Tipus d’emmagatzematge distribuït

Hi ha diferents tipus de sistemes d’emmagatzematge distribuïts que permeten crear sistemes independents i descentralitzats. Alguns dels sistemes més utilitzats són:

Sistema IPFS

Aquest sistema té com a objectiu connectar tots els dispositius en un únic sistema de fitxers distribuït basat en un protocol peer-to-peer (p2p). De forma similar a com funciona BitTorrent permet que els usuaris cerquin a la xarxa segons el contingut de les dades (no per la ubicació d’aquestes) i a part actuïn com a hosts emmagatzemant dades de tercers. Per aconseguir-ho utilitza tecnologies com HST i sistemes de gestió de versions com Git.

Sistema RAID

Aquest sistema d’emmagatzematge utilitza múltiples unitats de discos durs en les quals es distribueix i replica la informació. Hi ha diferents tipus de sistemes Raid, com el Raid 0 per millorar el rendiment, el raid 1 o forma mirall per reflectir de manera idèntica les dades en diferents discos, o en Raid 10 que combina els dos tipus de Raid.

Sistema GlusterFS

És un sistema d’arxius per NAS que permet afegir diversos servidors d’arxius sobre una xarxa Ethernet o un gran entorn d’arxius de xarxa en paral·lel. GlusterFS es desenvolupa sota el sistema de llicència GNU pel que és gratuït i es pot utilitzar tant servidors físics com virtualitzats.

CEPH: la solució d’emmagatzematge distribuït de software lliure

Amb CEPH es disposa d’una tecnologia d’emmagatzematge distribuït basat en software de codi obert que cada vegada és més popular en una àmplia varietat de sistemes d’orquestració en el núvol.

Implementar CEPH en els servidors és molt senzill i ofereix una solució que funciona de manera eficient per gestionar les dades de forma distribuïda. Tot i ser un projecte relativament jove es tracta d’una opció consolidada per la qual cosa compta amb gran suport a la xarxa com manuals i informació diversa sobre la seva instal·lació i configuració.

CEPH es compon de diversos components que li donen funcionalitat com el OSD (object storage daemon), Monitor (per monitorar l’estat del clúster i tots els components), Servidor de metadades (per reduir càrrega del clúster) i Managers (per manejar diferents aspectes com la utilització de l’espai).

L’administració de sistemes d’emmagatzematge distribuït amb CEPH és una solució econòmica i eficient que pot implementar-se de forma senzilla.

VMware: una altra alternativa d’emmagatzematge distribuït

VMware és una eina de virtualització que s’ha convertit en un estàndard en l’àmbit global. Amb VMware es poden virtualitzar sistemes operatius i crear arquitectures d’emmagatzematge en centres de dades separant la gestió i distribució de l’emmagatzematge del hardware físic. Amb aquesta eina s’ofereix una solució d’emmagatzematge flexible, automatitzada i escalable que s’adapti a les necessitats de les aplicacions actuals.

Amb VMware es pot crear un sistema d’emmagatzematge per software (SDS) on les aplicacions es distribueixen de forma dinàmica, assignant els recursos necessaris de capacitat i rendiment. En VMware la màquina virtual i l’aplicació es converteixen en el centre de gestió i distribució de l’emmagatzematge.

Amb aquest sistema es poden augmentar els recursos d’emmagatzematge sense interrupcions en el sistema. A més, es poden crear serveis d’emmagatzematge específics per a cada aplicació.

L’emmagatzematge de dades ha anat evolucionant per adaptar-se a les necessitats de les persones i les empreses. Estem en un punt on la gran demanda d’emmagatzematge requereix un canvi en l’enfocament tradicional amb un sistema especialitzat i independent d’emmagatzematge. L’emmagatzematge distribuït és la solució per aconseguir que els sistemes funcionin de forma més ràpida i eficient, sense perdre cap arxiu d’informació.

Aquest sistema d’emmagatzematge treu un major rendiment dels recursos, disminuint els costos d’emmagatzematge i incrementant la seguretat i agilitat en la gestió i accés a les dades.

Share this post
Comparativa Cloudflare vs Amazon CloudFront vs Akamai Edge vs Fastly