Cloudera ha confirmado que Cloudera Data Science Workbench, su nueva herramienta de autoservicio para los científicos de datos, ya está disponible. Anunciada en el Strata+Hadoop World San Jose 2017, se configura como una solución de autoservicio segura, rápida y sencilla. “Nos encontramos a las puertas de la edad de oro del machine learning y todo gira en torno a los datos. Sin embargo, los científicos de datos continúan teniendo problemas a la hora de crear y probar nuevos proyectos analíticos al ritmo que les gustaría, especialmente en entornos de gran escala“, ha explicado Charles Zedlewski, senior vice president, products en Cloudera. “Data Science Workbench es una herramienta de autoservicio que acelera la capacidad de crear, escalar e implementar soluciones de machine learning utilizando las tecnologías más potentes. Esto significa que los científicos de datos tienen ahora libertad para compartir, colaborar y administrar sus datos como mejor les convenga a ellos y a su empresa, haciendo más rápido y sencillo el camino hacia la producción”.
Con Python, R y Scala en el navegador, Cloudera Data Science Workbench ofrece una auténtica experiencia autoservicio para el data science. Y lo hace al ofrecer a los usuarios la posibilidad de descargar y experimentar con lo último en bibliotecas y frameworks en entornos de trabajo personalizables. Cloudera Data Science Workbench no solo es seguro, sino que además ofrece soporte para autenticación, autorización y encriptación en Hadoop.
La Oficina de Estadísticas Nacionales (ONS, por sus siglas en inglés), el mayor productor independiente de estadísticas oficiales del Reino Unido, quiere utilizar Cloudera Data Science Workbench para crear una investigación estadística precisa y transferible. “Hemos constatado una disminución en el tiempo de desarrollo de los modelos y una mayor visibilidad en el seguimiento del progreso y los resultados”, asegura Simon Sandford-Taylor, Chief Technology Officer. “En nuestra opinión, Cloudera Data Science Workbench tiene el potencial para acelerar nuestro calendario de lanzamientos y ayudarnos a compartir nuestras mejores prácticas”.
Cloudera Data Science Workbench se integra fácilmente con frameworks complejos, incluyendo BigDL, una biblioteca de aprendizaje profundo para Apache Spark en código abierto, creada por Intel. Construida desde cero para trabajar con la infraestructura Spark/Hadoop y optimizada para procesadores Intel® Xeon® (junto con la biblioteca Math Kernel de Intel®), BigDL es capaz de funcionar directamente desde dentro de Cloudera Data Science Workbench.
Los beneficios de la integración de BigDL en Data Science Workbench incluyen la posibilidad de aprovechar las bibliotecas y tácticas de aprendizaje profundo en la arquitectura de la CPU sin necesidad de recurrir a consideraciones de hardware adicionales o a entornos separados. Esta combinación permite crear pipelines de datos de Spark de forma nativa e integrarlos con la biblioteca de aprendizaje profundo (BigDL) y con otros componentes de Spark / Hadoop en Cloudera Data Science Workbench.