Ceph vs GlusterFS – en que se diferencian

Ceph vs GlusterFS – en que se diferencian.

Almacenar datos a gran escala no es lo mismo que guardar un archivo en nuestro disco duro. Se requiere de un software administrador que haga un seguimiento de todos los bits que agrupan los archivos que se alojan.

Ahí es precisamente donde trabajan las aplicaciones administradoras de un almacenamiento distribuido, como pueden ser Ceph o Gluster.

Existen otros métodos, pero Ceph y Gluster son los dos sistemas más usados. Comúnmente se les conoce como aplicaciones que definen el almacenamiento por software, por tanto son independientes del hardware. Su principal función es organizar los bits que componen los datos haciendo uso de su propia infraestructura subyacente.

Cada una de las dos opciones tiene sus propias características, y aunque el fin es el mismo, realmente son muy diferentes y si quieres montar un buen sistema de almacenamiento debes conocer para que está indicada cada herramienta.

Esta decisión se desea tomar dependiendo de varios pautas, por ejemplo:

  • Tipo de datos
  • Cómo se accede a los datos
  • Donde se localizan los datos

Tanto Ceph como GlusterFS son excelentes opciones, pero sus usos ideales son diferentes.

Ceph vs GlusterFS – en que se diferencian es lo que veremos en este articulo.

 

Ceph vs GlusterFS

Ceph

Ceph vs GlusterFS CEPH

 

Ceph es un sistema basado en objetos, lo que quiere decir que administra los datos almacenados como objetos en vez de con jerarquía de archivos, distribuyendo datos binarios en todo el clúster. Facebook utiliza el método de almacenamiento de objetos para almacenar imágenes y Dropbox para almacenar los archivos que suben los clientes.

El almacenamiento de objetos admite datos masivos no estructurados, por tanto es perfecto para el almacenamiento de datos masivos. El sistema se mantiene mediante una red de demonios en forma de monitores del clúster, servidores de metadatos y almacenamiento registrado. Lo dicho anteriormente hace que Ceph sea capaz de lo mejor, pero también que sea más complejo que otras opciones.

Ceph usa sus propias herramientas para administrar el almacenamiento, y eso requiere que los sysadmin conozcan muy bien sus herramientas.

El funcionamiento de Ceph no es sencillo, y se requiere un gran conocimiento. Si el administrador de una empresa adquiere los conocimientos necesarios para manejar Ceph, los beneficios serán muchos. El sistema de autogestión y autorrecuperación reduce dramáticamente las interrupciones, con lo que se genera más prestigio y beneficio económico.

Ceph puede correr en un servidor estándar, esto también es importante pues permite reducir costes.

Se permite crear almacenamiento por bloques, ofreciendo acceso a las imágenes de los dispositivos de bloques que pueden eliminarse y replicarse en todo el clúster.

Las aplicaciones pueden acceder a Ceph Object Storage a través de una interfaz RESTful que admite las API de Amazon S3 y Openstack Swift.

Las principales características son un alto rendimiento, almacenamiento masivo excelente, y una gran compatibilidad.

 

GlusterFS

Ceph vs GlusterFS GLUSTERFS

 

GlusterFS, más conocido como Gluster, es un almacén de archivos algo más tradicional.

Más fácil de configurar y se puede usar en cualquier sistema que tenga una carpeta. La flexibilidad y la facilidad de uso son una gran ventaja de este sistema, por contra no se debe escalar a una excesiva capacidad, el rendimiento disminuiría de manera drástica.

Gluster está indicado para archivos de gran tamaño(minimo 4 MB) y con un acceso secuencial.

Un clúster puede extenderse sobre servidores físicos, virtuales y en la nube, lo que permite una virtualización de almacenamiento muy flexible y económica.

Gluster utiliza el almacenamiento de bloques, osea que los fragmentos de datos se almacenan en un espacio abierto en los dispositivos interconectados al clúster. El almacenamiento basado en archivos y bloques utiliza un sistema que organiza los archivos en árboles jerárquicos.

Se permite agregar servidores al cluster que estén lejanos geográficamente, así se consigue crear un sistema de archivos en red escalable.

Realmente Gluster es una versión de FUSE y NFS basada en clúster, que ofrece una arquitectura conocida para la mayoría de los sysadmin. Está pensado para ser simple, fácil de mantener y para uso general, por contra no ofrece la velocidad de acceso de Ceph.

 

Conclusión final

Ceph está indicado para un acceso rápido de datos no estructurados, que realmente son la gran mayoría de los archivos.

Gluster es mucho mejor para el acceso secuencial de datos, como puede ser la transmisión de vídeo (streaming), y aplicaciones donde la velocidad no es importante, como pueden ser los backups.

 

En Sololinux.es seguimos creciendo gracias a nuestros lectores, puedes colaborar con el simple gesto de compartir nuestros artículos en tu sitio web, blog, foro o redes sociales.

 

Agregar comentario