SAP ha evolucionado su Data Warehouse Cloud con SAP Datasphere. Se han integrado nuevas funcionalidades para responder a las constantes evoluciones del panorama de datos. Descubre esta solución de datos de nueva generación.
¿Qué es SAP Datasphere?
Lanzado en marzo de 2023, SAP Datasphere es la nueva generación de Data Warehouse Cloud. Al igual que su predecesor, Datasphere proporciona a las empresas un almacenamiento de datos disponible en la nube.
Pero la organización ha incluido nuevas funcionalidades que permiten a “SAP convertirse en un actor más importante en el espacio de data fabric”.
Esta nueva solución se inscribe plenamente en la diversificación del panorama de los expertos de datos. Los competidores son cada vez más numerosos y se vuelve imposible recuperar todas las partes del mercado. Por lo tanto, para hacer frente a esta creciente competencia, SAP se adapta ofreciendo mayor flexibilidad a sus clientes (particularmente para la transferencia de datos).
¿Cuáles son las nuevas funcionalidades de SAP Datasphere?
Una integración de datos mejorada
SAP Datasphere ofrece una mejor experiencia de integración de datos. Y esto, de varias maneras:
- Los usuarios ahora pueden importar datos de una amplia gama de fuentes (nube, en sitio, datos SAP, datos no SAP).
- Los productos BW/4HANA y S/4HANA están integrados nativamente en la solución, lo que facilita el acceso a los datos en los entornos SAP existentes.
- Se han añadido funcionalidades de integración poderosas, como el mapeo de datos, la transformación y la calidad de los datos.
El catalogado de datos
El catálogo SAP Datasphere mejora la gestión de datos gracias a funcionalidades de perfilado de datos automatizadas, funcionalidades de búsqueda y un glosario.
Los usuarios se benefician así de una vista simplificada de su flujo de datos. Ahora pueden:
- generar información sobre las características y la calidad de los datos;
- acceder fácilmente a datos confiables para una modelización de calidad;
- analizar el historial y el impacto de los datos en la toma de decisiones.
La modelización de datos
La modelización es posible a través de dos herramientas complementarias:
- Data Builder: con su interfaz simplificada, este editor de modelización permite combinar, limpiar y preparar los datos para utilizarlos en herramientas de restitución de datos. Los usuarios pueden entonces crear vistas gráficas, vistas SQL, tablas, modelos analíticos, flujos de datos, cadenas de tareas, etc.
- Business Builder: esta herramienta permite combinar, refinar y enriquecer objetos ya creados en Data Builder. También puede ser usada para crear unidades de negocio, modelos de consumo y perspectivas.
Para cumplir esta misión de manera efectiva, un profesional debe desarrollar ciertas competencias clave además de su experiencia tradicional en gestión de sistemas de información. Debe adquirir imperativamente una comprensión profunda de los conceptos y técnicas de Ciencia de Datos. Un sólido dominio de las matemáticas es requerido, al igual que los principios fundamentales de las estadísticas como la probabilidad, las distribuciones o las pruebas de hipótesis y de regresión.
Esto permitirá al administrador de sistemas entender los modelos y los análisis estadísticos utilizados en la Ciencia de Datos. Un conocimiento que podrá aplicar él mismo o usar para colaborar con los expertos.
Las habilidades en programación son también indispensables, en particular en lo que respecta a los lenguajes como Python, R y SQL muy utilizados para el análisis de datos o la construcción de modelos predictivos.
Igualmente, las técnicas de Data Mining, de Aprendizaje Automático y de análisis predictivo deben ser conocidas a la perfección. Esto incluye los algoritmos comúnmente usados como las redes neuronales, los árboles de decisión o los métodos de conjuntos.
Un administrador moderno también debe conocer las herramientas y plataformas de Ciencia de Datos populares como TensorFlow, Scikit-learn o Spark.
Las competencias en gestión de proyectos o de recursos son también un valioso activo. Permiten hacerse cargo de las tareas de gestión y organización de ciencia de datos: coordinación de las partes interesadas, establecimiento de prioridades, asignación de recursos, seguimiento de los avances…
Más allá de las habilidades técnicas, las competencias personales en comunicación y colaboración también son esenciales. Porque, hoy en día, el administrador SI trabaja mano a mano con los Científicos de Datos.
La gestión de los espacios de trabajo
Los espacios de trabajo son repositorios de datos que representan un sector de actividad específico. SAP Datasphere los pone a disposición de sus usuarios, para proporcionarles un entorno de modelización centralizado y seguro.
Se pueden utilizar para diferentes departamentos o casos de uso. Y sobre todo, los administradores pueden gestionarlos según las necesidades de la organización. Además de la creación de estos entornos virtuales, pueden asignar espacio de almacenamiento (disco y memoria), definir su prioridad, agregar usuarios y asignarles roles, utilizar herramientas de monitoreo y registro, etc.
Las otras novedades
Además de las funcionalidades mencionadas anteriormente, SAP Datasphere trae otras mejoras:
- Funcionalidades de gobernanza de datos reforzadas para garantizar la calidad, seguridad y conformidad de los datos;
- Una arquitectura cloud native diseñada para mayor escalabilidad, flexibilidad y rentabilidad;
- Un acceso de autoservicio para fomentar la democratización de los datos;
- Nuevas alianzas estratégicas con Databricks, Collibra, Confluent y DataRobot.
Gracias a todas estas nuevas funcionalidades, SAP Datasphere permite a las empresas modernizar su infraestructura de gestión de datos para aprovechar plenamente el valor de sus datos. Se convierte en una herramienta absolutamente imprescindible para los expertos en datos.
¿Deseas aprender a utilizarla? Únete a DataScientest.