Azure Machine Learning es un servicio web para la creación y despliegue de modelos de aprendizaje automático o Machine Learning (ML) dirigido a equipos de ciencia de datos. Permite construir, probar, gestionar, desplegar y monitorear estos modelos en un entorno en la nube escalable, de modo que se puede realizar análisis de datos de Big Data con fines de análisis predictivo.
Objetivos de la formación en Microsoft Azure Machine Learning
Cuando se necesita crear, entrenar y desplegar modelos de Machine Learning, las herramientas empleadas suelen ser:
- Azure Machine Learning Studio: es un espacio de trabajo donde creas, construyes y entrenas modelos de aprendizaje automático.
- Azure Machine Learning para Visual Studio Code Extension: es una extensión gratuita que permite gestionar recursos, flujos de trabajo de formación de modelos y despliegues en Visual Studio Code.
Durante las prácticas, un curso de Azure Machine Learning tiene como objetivo, entre otros, que el estudiante pueda:
- Tomar control de la interfaz de este servicio de Azure de aprendizaje automático
- Saber elegir entre las variables de algoritmos así como los algoritmos equivalentes en función a la problemática presentada
- Dominar los lenguajes de programación comúnmente utilizados para optimizar Azure Machine Learning (R y Python)
- Adquirir experiencia en servicios web dedicados al aprendizaje automático
Requisitos previos para formarse en Azure Machine Learning
Antes de empezar un curso de Azure Machine Learning, es importante tener algunos conocimientos básicos:
- Una comprensión de los conceptos de Machine Learning
- Conocimiento de los conceptos de Cloud Computing
- Comprensión general de los contenedores y la orquestación
- Experiencia en programación en Python o R
- Experiencia trabajando con una línea de comandos
Principales destinatarios de un curso de Azure Machine Learning
Un curso de Azure Machine Learning está dirigido a ingenieros que deseen utilizar la plataforma «drag-and-drop» de Microsoft Azure para desplegar cargas de trabajo de aprendizaje automático sin tener que adquirir software y hardware, ni preocuparse por el mantenimiento y despliegue. En otras palabras, está destinado a:
- Científicos de Datos
- Ingenieros de Datos: es fundamental que quienes se especialicen en la gestión de datos puedan ampliar sus conocimientos sobre cómo Azure facilita la integración y orquestación de flujos de datos con servicios como Azure Data Factory
- Ingenieros DevOps interesados en el despliegue de modelos de aprendizaje automático
- Ingenieros de Machine Learning interesados en el despliegue de modelos de aprendizaje automático
- Ingenieros de Software que deseen automatizar la integración y despliegue de funcionalidades de Machine Learning en su aplicación
Contenido de un curso de Azure Machine Learning
Un curso de Azure Machine Learning se centra principalmente en asegurar el dominio del flujo de trabajo en este servicio en la nube. Por tanto, al igual que la ejecución de un workflow del servicio Azure Machine Learning, comprende tres etapas:
1. Preparación de datos
Esta es la primera etapa en la creación de un modelo de aprendizaje automático que comprende la recolección y el procesamiento de datos desde un Datastore y un Datasets, incluyendo la interacción con plataformas de Big Data como Azure Databricks.
Estos son algunos ejemplos de servicios de almacenamiento de Azure compatibles que pueden ser registrados como bancos de datos:
- Azure Data Lake
- Azure SQL Database
- Databricks File System
- Azure Blob Storage
2. Experimentación
Una vez registrados y almacenados los datos en el conjunto de datos, el siguiente paso es crear, entrenar y probar el modelo.
El modelo es un fragmento de código que recibe entradas y produce salidas para dichas entradas. El desarrollo de un modelo ML requiere seleccionar un algoritmo, contar con datos y ajustar los hiperparámetros. El curso incluye un proceso iterativo que proporciona un modelo entrenado que hereda lo que ha aprendido durante el proceso de entrenamiento. El modelo se obtiene ejecutándolo en Azure Machine Learning.
Claro está, también es necesaria una fuente de cálculo donde ejecutar el script de entrenamiento. Azure Machine Learning tiene la ventaja de permitir el aprendizaje automático de un modelo sobre diferentes objetivos de cálculo:
- Local Compute: entorno de cálculo donde se ejecuta el código de envío de experimentos.
- Compute Cluster: clúster virtual gestionado por Azure Machine Learning.
- Inference Cluster: objetivo de despliegue basado en contenedores.
- Attached Compute: Azure Databricks, Azure Data Analytics, etc.
3. Despliegue
Una vez formado y probado el modelo, se almacena en el registro de modelos y luego se despliega en un servicio web o módulos IoT. El modelo registrado se despliega como endpoint del servicio. Se instancia la imagen en un servicio web que luego se hospeda en la nube o en un módulo IoT para su uso en un despliegue de dispositivos integrados.
Al final del curso, los estudiantes serán capaces de:
- Escribir modelos de Machine Learning muy precisos utilizando herramientas de programación Python o R;
- Aprovechar los conjuntos de datos y algoritmos disponibles en Azure ML para entrenar y monitorear modelos de Machine Learning y Deep Learning;
- Usar el espacio de trabajo interactivo de Azure Machine Learning para desarrollar en colaboración modelos de aprendizaje automático.