HDFS todavía hace una cosa realmente bien: almacenar archivos grandes en múltiples máquinas con una sólida tolerancia a fallos. Es excelente para cargas de trabajo por lotes y funciona de maravilla cuando se combina con Spark, Hive o trabajos tradicionales de Hadoop. Una vez que lo has configurado correctamente, es estable y hace su trabajo silenciosamente en segundo plano. Para las antiguas canalizaciones de big data en instalaciones locales, es un caballo de batalla confiable. Reseña recopilada por y alojada en G2.com.
Seamos realistas, HDFS no está a la altura de los tiempos. En el mundo actual de almacenamiento nativo en la nube, sin servidor y con autoescalado, HDFS se siente como usar un Nokia en un mundo de iPhones. Escalar significa más hardware, más dolores de cabeza. Gestionar NameNode/SecondaryNameNode es como cuidar a un niño: un movimiento en falso y tu clúster hace un berrinche.
Maneja bien los archivos grandes, pero si le das demasiados archivos pequeños, se atraganta. También carece de la flexibilidad y eficiencia de costos del almacenamiento en la nube, no tiene la sensación de un servicio gestionado, y ni siquiera preguntes sobre el acceso a nivel de objeto.
¿Seguridad, actualizaciones y mantenimiento? Todo un trabajo en sí mismo. Terminarás necesitando un equipo dedicado solo para mantener las cosas funcionando sin problemas. Reseña recopilada por y alojada en G2.com.
Validado a través de LinkedIn
A este revisor se le ofreció un incentivo nominal como agradecimiento por completar esta reseña.
Reseña orgánica. A este revisor se le ofreció un incentivo nominal como agradecimiento por completar esta reseña.
Esta reseña ha sido traducida de English usando IA.


