Desde los albores de la era del Big Data, Dell Technologies y Cloudera han trabajado juntos en el desarrollo de numerosas soluciones para aplicaciones de análisis flexibles, escalables y de clase empresarial basadas en el software Cloudera y la infraestructura de Dell EMC.
Dichas soluciones han ido creciendo, comprendiendo mucho más que el entorno Apache Hadoop. De hecho, la plataforma de datos moderna incluye multitud de capacidades y aplicaciones que abarcan el ciclo de vida completo de los datos, incluida la ingesta y recopilación; la ingeniería y el enriquecimiento de los mismos; el almacenamiento; el análisis; la generación de informes e incluso el análisis predictivo con Inteligencia Artificial y aprendizaje automático.
El último lanzamiento fruto de esta unión es Data Management con Cloudera Data Platform en infraestructura Dell EMC y tecnología de Intel. Se trata de un diseño validado para el análisis que incluye Cloudera Data Platform (CDP) Private Cloud Base 7.1.7 y servidores Dell EMC PowerEdge con procesadores escalables Intel Xeon de tercera generación.
CDP Private Cloud Base, anteriormente conocido como CDP Data Center, hereda lo mejor de Hortonworks Data Platform (HDP) y Cloudera Distribution para Hadoop (CDH) e incorpora numerosas características y capacidades nuevas. Además, contiene el conjunto más extenso de mejoras y rutas de actualización desde versiones anteriores hasta la fecha.
Principales componentes de CDP Private Cloud Base
CDP Private Cloud Base es la versión on-premise de Cloudera Data Platform e incluye los siguientes componentes:
–Cloudera Manager es una herramienta integral de gestión y administración que admite implementación y configuración automatizadas, supervisión y generación de informes personalizables, resolución robusta y sencilla de problemas y mantenimiento sin tiempo de inactividad (zero-downtime maintenance).
–Cloudera SDX son las siglas de Shared Data Experience, la experiencia de datos compartidos. Independientemente de las capas de cómputo y almacenamiento, SDX ofrece un conjunto integrado de tecnologías de seguridad y gobernanza basadas en metadatos que proporcionan un contexto duradero de todas las capacidades analíticas en la plataforma de datos multi-tenant.
-Amplia selección de aplicaciones analíticas que se ejecutan en clústeres de cómputo, incluidos Spark, Hive, Impala, Hbase, MapReduce y Solr, por nombrar solo algunos.
-Incluye varias opciones de almacenamiento, incluidos HDFS y Apache Ozone, y un almacén de objetos escalable, redundante y distribuido para Hadoop.
Y todo se ejecuta en la infraestructura de red, almacenamiento y servidor de Dell EMC más reciente que se diseñó y optimizó como una solución integrada completa, PowerEdge, PowerScale y PowerSwitch para Cloudera Data Platform.
Novedades de esta versión
Junto con las capacidades principales de CDP, la nueva versión Private Cloud Base 7.1.7 incorpora:
-Compatibilidad con servidores Dell EMC PowerEdge con procesadores escalables Intel Xeon de tercera generación, con configuraciones de rendimiento optimizado diseñadas y validadas para infraestructura y nodos de trabajo.
-Compatibilidad con almacenamiento Dell EMC PowerScale, una solución altamente flexible de network-attached storage scale-out que se puede usar como almacenamiento HDFS principal y que permite que las capacidades de cómputo y storage se escalen de manera independiente.
-Acceso a todas las funciones y capacidades nuevas del software CDP Private Cloud Base 7.1.7, incluidas:
- Mejoras en Cloudera Manager, incluidas correcciones de seguridad para múltiples bibliotecas integradas, lo que convierte a esta versión en la más segura de CDP PvC Base hasta el momento.
- Actualizaciones de SDX para mejorar la seguridad y el gobierno de la plataforma y los datos.
- Funciones de Ozone para una alta disponibilidad total.
- Mejoras de streaming, incluida la integración entre Kafka y Atlas para una mejor escalabilidad.
-En esta versión, se incluyen importantes mejoras de actualización para ayudar a los clientes en su migración a CDP Private Cloud Base, que incluyen:
- Las actualizaciones locales están disponibles para todas las versiones anteriores de CDH y HDP compatibles, incluidas CDH 6.1, 6.2 y 6.3, y HDP 2.6 y 3.1, sin tener que crear un nuevo clúster.
- Los procedimientos de reversión documentados están disponibles para CDH 6.xy para HDP 3.1.
- Guía complementaria de actualización.
¿Por qué elegir CDP Private Cloud Base?
CDP Private Cloud Base es importante por tres razones principales. En primer lugar, para nuevas implementaciones, esta solución es un modelo independiente completo de Cloudera Data Platform que ofrece potentes cargas de trabajo analíticas, transaccionales y de aprendizaje automático con cómputo y almacenamiento escalables. Contiene las últimas y mejores características heredadas de Hortonworks y Cloudera, y mucho más, y por lo tanto es la mejor opción para una plataforma de datos completa.
En segundo lugar, para actualizaciones de entornos CDH y HDP heredados, se presenta como la solución definitiva. Esta versión hace realidad la visión de Cloudera de actualizaciones en local de todas las versiones compatibles de CDH y HDP.
Y tercero, es la base de la última innovación de Cloudera, CPD Private Cloud Data Services. Juntos constituyen la oferta completa de nube privada de CDP. Data Services incluyen un conjunto de experiencias analíticas de autoservicio en contenedores que se ejecutan en Kubernetes, incluidos los servicios de ingeniería de datos, warehouse y aprendizaje automático. Estos servicios ya están disponibles en Cloudera y pronto lo estarán como parte de un diseño validado para el análisis de Dell Technologies.
Toda la documentación, incluido el documento técnico, la guía de diseño y el resumen de la solución, se puede encontrar en Dell Technologies Info Hub for Analytics.