¿Qué es un conjunto de datos? ¿Cómo manipularlo?
Los datasets (o conjuntos de datos) suelen utilizarse en Machine Learning. Agrupan un conjunto coherente de datos en distintos formatos (texto, números, imágenes, vídeos, etc.). ¿Qué es un conjunto de datos? Los conjuntos de datos pueden representarse de distintas formas, como tablas, gráficos, árboles, etc. Las estructuras de matrices se utilizan a menudo en algoritmos […]
Isolation Forest: ¿cómo detectar anomalías en un conjunto de datos?
Hoy echamos un vistazo a Isolation Forest, un algoritmo de Machine Learning diseñado para resolver problemas de clasificación binarios como la detección de fraudes o el diagnóstico de enfermedades. Esta técnica, presentada en la 8.ª Conferencia Internacional del IEEE en 2008, es la primera técnica de clasificación dedicada a la detección de anomalías basada en […]
Microstrategy: todo lo que necesitas saber sobre esta plataforma
En octubre de 2020, DataScientest se convirtió en el primer partner europeo de MicroStrategy, uno de los paquetes de software de Business Intelligence más utilizados para el análisis y visualización de datos. Descubre todo lo que necesitas saber sobre él: presentación, funcionamiento, usos, formación, etc. ¿Qué es MicroStrategy? MicroStrategy Incorporated es una empresa estadounidense de […]
CatBoost: Una herramienta esencial para el Machine Learning
Desde 2017, CatBoost se ha sumado a la gama de herramientas de Machine Learning existentes. Rápido, eficiente y preciso a la vez, CatBoost es una de las tecnologías líderes en el campo del Gradient Boosting. En este artículo, te explicamos todo lo que necesitas saber sobre esta tecnología: sus aplicaciones, sus ventajas y su funcionamiento. […]
IDE: ¿qué es un entorno de desarrollo integrado?
El desarrollo de software requiere el ensamblaje de muchos elementos: código, interfaz de usuario, estructura del proyecto, configuración del entorno y mucho más. Para simplificar este complejo proceso, se han creado varias herramientas. Una de estas herramientas es el IDE o “integrated development environment”: un entorno de desarrollo integrado. Los IDE están dirigidos a desarrolladores […]
¿Cuánto gana un Data Manager?
El sueldo de un Data Manager depende de su sector de actividad, experiencia, región geográfica y competencias adicionales. Descubre todo lo que necesitas saber en esta completa guía. En la era del Big Data, los Data Managers desempeñan un papel clave en la recopilación, organización y análisis de datos para las empresas. Por eso, este puesto […]
Data Mining: todo lo que tienes que saber
El Data Mining consiste en analizar grandes volúmenes de datos para descubrir tendencias y correlaciones. Descubre todo lo que tienes saber sobre ella: definición, funcionamiento, usos, profesiones y formación, etc. Para resolver sus problemas y descubrir nuevas oportunidades, las empresas de todos los sectores analizan enormes volúmenes de datos. Los Data Scientists y otros analistas […]
Data Strategist: todo lo que necesitas saber sobre esta profesión
El Data Strategist es un profesional responsable de desarrollar una estrategia basada en datos dentro de una empresa. Descubre todo lo que necesitas saber sobre esta profesión en auge. Hasta hace unos años, las empresas consideraban los datos como un mero activo. Los beneficios del análisis se consideraban útiles, pero no esenciales. Con el tiempo, […]
Docker: ¿qué es y cómo se usa?
Docker es la plataforma de contenedorización más utilizada. Descubre todo lo que necesitas saber sobre ella: qué es, para qué sirve, cómo funciona y qué cursos existen para aprender a utilizarla. Los contenedores y los microservicios se utilizan cada vez más para desarrollar y ejecutar aplicaciones. Es lo que se conoce como desarrollo “cloud-native”. En […]
GPU: ¿qué es y por qué puedes usarla en Data Science?
Añade aquí tu texto de cabecera Hay dos tipos principales de GPU en los ordenadores modernos: integrada y dedicada. El primer tipo está integrado directamente en el procesador, mientras que el segundo es independiente. Por lo general, las tarjetas gráficas para ordenadores de sobremesa son componentes de gran tamaño con ventiladores para su refrigeración. Estas […]
Dataiku: una herramienta esencial para la Data Science y la IA
Dataiku es una plataforma de Data Science unificada, de código abierto y basada en la nube. Ofrece funciones para la preparación de datos, el análisis y la creación de modelos de Machine Learning. Descubre todo lo que tienes que saber sobre esta herramienta esencial para la Data Science y la Inteligencia Artificial. El objetivo de […]
Ficha del perfil de Data Scientist
Descubre todo lo que necesitas saber sobre el perfil de Data Scientist: funciones, responsabilidades, competencias, sueldo, formación existente, etc. Con el auge del Big Data, las empresas disponen ahora de un inmenso volumen de datos. Para analizarlos, darles sentido y extraer su información útil, recurren a los servicios de los Data Scientists. ¿Qué hace un […]