MongoDB: todo sobre la base de datos NoSQL orientada a documentos

MongoDB

MongoDB es una base de datos NoSQL orientada a documentos. Se diferencia de las bases de datos relacionales por su flexibilidad y rendimiento. Descubre todo lo que necesitas saber sobre esta herramienta imprescindible para la ingeniería de datos. MongoDB es una base de datos NoSQL orientada a documentos que apareció a mediados de la década […]

Encapsulación: definición e importancia

encapsulation

La encapsulación es un concepto importante en la programación orientada a objetos. Descubra todo lo que hay que saber al respecto.  La encapsulación es un mecanismo para reunir datos y métodos dentro de una estructura ocultando la implementación del objeto, es decir, impidiendo el acceso a los datos por cualquier medio que no sean los […]

Datacleaning Limpieza de datos: definición, técnicas, importancia en Data Science

Data cleaning

La limpieza de datos es un proceso esencial en la Data Science y en Machine Learning. Consiste en resolver anomalías en conjuntos de datos(Datasets), para poder explotarlos después. Definiciones, técnicas, casos de uso….  Los datos son esenciales en la ciencia de los datos, la inteligencia artificial y el machine learning . Es el combustible de […]

Azure Data Factory: ¿qué es y para qué sirve?

azure data factory

En la era del Big Data, los datos brutos suelen estar desorganizados y almacenados en sistemas a veces dispares. Cuando estos datos están aislados, las empresas y los equipos de datos no pueden sacar el máximo partido de ellos ni tomar decisiones. La solución Microsoft Azure Data Factory tiene como objetivo superar estas dificultades y […]

PySpark : Todo sobre la biblioteca Python

pyspark

Cuando hablamos de procesamiento de bases de datos en python, pensamos inmediatamente en la biblioteca pandas. Sin embargo, cuando se trata de bases de datos demasiado masivas, los cálculos se vuelven demasiado lentos.Afortunadamente, existe otra biblioteca de python, bastante cercana a pandas, que permite procesar cantidades muy grandes de datos: PySpark.  Apache Spark es un […]

¿Cómo generar un Wordcloud con Python?

wordclouds python

Las Wordcloud (nubes de palabras) son herramientas útiles para resumir los conceptos más importantes de un texto, una página web o un libro. Cuanto más presente esté una palabra en el texto considerado, más grande aparecerá en la nube de palabras. Hay muchos sitios y aplicaciones para generar nubes de palabras de forma fácil y […]