Cloudera ha anunciado que Cloudera Data Platform (CDP) integrará el acelerador RAPIDS para Apache Spark 3.0., instalado en plataformas informáticas NVIDIA. El software permite a las empresas acelerar las canalizaciones de datos y ampliar los límites de rendimiento de los flujos de trabajo de datos y aprendizaje automático (ML) para impulsar una adopción de Inteligencia Artificial (IA) más rápida y ofrecer mejores resultados comerciales, sin cambiar ningún código.
Con el lanzamiento a principios de este año de Applied ML Prototypes (AMP) en CDP y el poder de la computación NVIDIA, clientes como el Servicio de Impuestos Internos y la Oficina de Estadísticas Nacionales del Reino Unido no solo pueden impulsar casos de uso de ML completamente empaquetados, sino también acelerar el procesamiento de datos y capacitar los modelos a un coste menor en cualquier implementación local, de nube pública o de nube híbrida.
Los ingenieros de datos empresariales están utilizando conjuntos de datos en una magnitud y escala nunca antes vistas, como la transformación de los modelos de la cadena de suministro, la respuesta al aumento de los niveles de fraude o el desarrollo de nuevas líneas de productos.
Para los científicos de datos, los cuellos de botella creados por cantidades masivas de datos impactan directamente en el coste y la velocidad a la que las empresas pueden entrenar y operar modelos en toda la organización. Se espera que la integración de Cloudera y NVIDIA genere a las empresas la capacidad de responder rápidamente a los desafíos comerciales emergentes en curso y crear análisis detallados.
“Necesitamos poder tomar decisiones con precisión a gran velocidad utilizando ingentes cantidades de datos. Este desafío está en constante evolución a medida que los volúmenes de datos y las velocidades continúan aumentando”, aseguró Joe Ansaldi, Research Applied Analytics & Statistics Division (RAAS) y Technical Brand Chief del Servicio de Impuestos Internos (IRS) de los Estados Unidos. “La integración de Cloudera y NVIDIA nos permitirá utilizar conocimientos basados en datos para impulsar casos de uso de misión crítica como la detección de fraude. Actualmente estamos implementando esta integración y ya estamos viendo incrementos de velocidad hasta tres veces mayores para nuestros flujos de trabajo de ingeniería y ciencia de datos”.
Para cada empresa que tiene que hacer frente a conjuntos de datos masivos, una canalización acelerada por una GPU de código abierto significa la diferencia entre poder entrenar modelos o no poder hacerlo nunca. Tal canalización puede potenciar directamente la capacidad de una organización para transformarse utilizando Inteligencia Artificial. Apache Spark 3 acelerado por GPU se ejecuta sin problemas en Cloudera Data Platform, lo que permite a las organizaciones respaldar las necesidades de HPC, IA y ciencia de datos, desde la investigación hasta la producción, con una plataforma segura, escalable y abierta para el aprendizaje automático.
“En un momento en el que la velocidad lo es todo, las empresas confían en el poder de los datos más que nunca. Nuestra colaboración con NVIDIA brindará a los clientes el espacio que necesitan para comprender mejor sus datos y darse cuenta del verdadero potencial de transformación de la IA ”, apuntó Arun Murthy, director de producto de Cloudera. “Las experiencias analíticas de CDP están diseñadas específicamente para permitir que los especialistas en datos naveguen con confianza en la tormenta del crecimiento exponencial de datos y el análisis de datos en silos, operando en múltiples nubes públicas y privadas. Profundizar nuestra integración existente con NVIDIA es el siguiente paso natural para nosotros. Nuestros clientes podrán mantener la ventaja competitiva que ya tienen mediante el uso de nuestros servicios de Enterprise Data Cloud”.
“Apache Spark es la piedra angular de los procesos de análisis de datos y aprendizaje automático en los que las empresas confían para seguir siendo competitivas”, afirmó Scott McClellan, director senior del grupo de productos de ciencia de datos de NVIDIA. “La potencia de procesamiento de la computación acelerada por NVIDIA y el análisis de Spark que se ejecuta en Cloudera Data Platform generan la flexibilidad necesaria para cumplir con los plazos cuando el tiempo es esencial y ahorrar costes cuando el resultado final es más importante”.
El acelerador RAPIDS para Apache Spark estará disponible en CDP Private Cloud este verano. NVIDIA y Cloudera lanzarán ofertas adicionales aceleradas en CDP a lo largo del tiempo, comenzando con Accelerated Deep Learning y Machine Learning en CDP Public Cloud en mayo.