Beautiful Soup : ¿cómo aprender a hacer web scraping en Python?

Como usuario de Internet, uno tiene acceso a mucha información sobre clientes, ofertas, cotizaciones de acciones, fenómenos físicos, etc. Los usuarios pueden leer estos datos, pero nos gustaría poder explotarlos transformándolos en un formato operativo para finalmente analizarlos y aprovecharlos. El web scraping es la técnica que permite extraer esta información en un formato que […]

Scikit-Learn : Descubre la biblioteca de Python dedicada al Machine Learning

Si estudias datos y quieres extraer información de ellos, a menudo tendrás que procesarlos , modificarlos y, sobre todo, construir modelos capaces de determinar cuáles son los patrones de tus datos para un problema determinado. Muchas bibliotecas de código abierto permiten hacer esto hoy en día, pero la más conocida de ellas es seguramente Scikit-Learn. […]

Statsmodels : todo acerca de la biblioteca de Python

statsmodels

Si alguna vez has intentado modelar series temporales, probablemente habrás oído hablar de los modelos ARMA o ARIMA. En Python la biblioteca más utilizada para esto es statsmodels. En este artículo presentaremos rápidamente los usos de statsmodels y algunos ejemplos de uso. ¿Qué hacer con statsmodels? Statsmodels es una biblioteca de análisis y modelado de […]

¿Por qué Linux es el sistema operativo preferido de los desarrolladores?

imagen_linux

Cuando la gente habla de Linux, por lo general, eso implica también la necesidad de aprender a desarrollar, adquirir competencias en ese sistema operativo, y, por tanto, puede dar miedo. ¿Pero está realmente justificado? Esto es lo que intentaremos descifrar en este artículo. ¿Qué es Linux? Linux es un sistema operativo tipo Unix basado en […]

Hacer Data Visualisation gracias a Plotly

plotly

Es bueno saber que Plotly, antes de ser una conocida librería Python, es una empresa con sede en Montreal que fue fundada por cuatro personas. Su objetivo es desarrollar herramientas de visualización y analizar datos. En este artículo, nos centraremos en la librería Python plotly. ¿Qué otras herramientas ofrece Plotly? Los productos de la empresa […]

Matplotlib: todo lo que tienes que saber sobre la librería Python de Dataviz

matplotlib

Matplotlib es una librería Python open source que permite crear visualizaciones de datos. Descubre todo lo que tienes que saber: definición, funcionamiento, dificultades, cursos, etc. Cheat Sheet Matpolib : Descargar La visualización de datos es una etapa clave del análisis de datos. Después de haber recopilado, almacenado y analizado datos, es esencial transformar los resultados […]

API : ¿qué es y para qué sirve?

api

Las interfaces de programación applicative se han hecho imprescindibles en todos los sectores de actividad. Banca, marketing, digital, el desarrollo de las APIs sigue creciendo, al igual que la cantidad de datos que hay que procesar. Pero, ¿de qué estamos hablando exactamente y para qué se utiliza ? Una API, el acrónimo de Application programming […]

Python o R : ¿Qué elegir?

Python ou R

¿Python o R? Es una pregunta habitual cuando se empieza a programar : ¡DataScientest hace un balance de la situación en un partido igualado! ¿Python o R? La respuesta en este partido en 5 rondas En primer lugar, hay que entender que ningún lenguaje de programación es mejor que otro.  Sin embargo, el hecho de […]

MongoDB : todo sobre la base de datos NoSQL orientada a documentos

MongoDB

MongoDB es una base de datos NoSQL orientada a documentos. Se diferencia de las bases de datos relacionales por su flexibilidad y rendimiento. Descubre todo lo que necesitas saber sobre esta herramienta imprescindible para la ingeniería de datos. MongoDB es una base de datos NoSQL orientada a documentos que apareció a mediados de la década […]

Encapsulación: definición e importancia

encapsulation

La encapsulación es un concepto importante en la programación orientada a objetos. Descubra todo lo que hay que saber al respecto.  La encapsulación es un mecanismo para reunir datos y métodos dentro de una estructura ocultando la implementación del objeto, es decir, impidiendo el acceso a los datos por cualquier medio que no sean los […]

PySpark : Todo sobre la biblioteca Python

pyspark

Cuando hablamos de procesamiento de bases de datos en python, pensamos inmediatamente en la biblioteca pandas. Sin embargo, cuando se trata de bases de datos demasiado masivas, los cálculos se vuelven demasiado lentos. Afortunadamente, existe otra biblioteca de python, bastante cercana a pandas, que permite procesar cantidades muy grandes de datos : PySpark.  Apache Spark […]

¿Cómo generar un Wordcloud con Python?

wordclouds python

Las Wordcloud (nubes de palabras) son herramientas útiles para resumir los conceptos más importantes de un texto, una página web o un libro. Cuanto más presente esté una palabra en el texto considerado, más grande aparecerá en la nube de palabras. Hay muchos sitios y aplicaciones para generar nubes de palabras de forma fácil y […]