25.10.0
This website uses cookies to ensure you get the best experience on our website. Learn more

Tratamiento de datos en Python: ETL de cero a experto

Pablo Castelló Torregrosa

La proliferación exponencial de nuevos tipos de fuentes de datos y el ritmo de generación de los mismos son probablemente los factores clave detrás del auge de toda la innovación que conlleva el Big Data y el análisis de datos en general. Por eso, como profesionales en este sector, no sólo es importante tener la capacidad de generar y entrenar modelos, sino aprender a desarrollar sistemas que puedan generar para nosotros nuestros propios sets de datos. Sin embargo, aun teniendo acceso a cantidades brutales de datos, estos no siempre son ni fácilmente accesibles ni suelen estar en los formatos ni estándares de calidad que deseamos. Nuestra misión será dotarte de conocimientos y herramientas para poder afrontar estos escenarios con éxito. En este curso vas a aprender a hacerlo cubriendo todo el ciclo de vida del dato y no sólo con un enfoque práctico, sino también usando fuentes y datos reales. Conocerás y practicarás para dominar un montón de herramientas y tecnologías relacionadas con el mundo del manejo de datos, sobretodo en relación a la obtención, la transformación o manipulación y la carga de los mismos. El curso se desarrolla sobre el concepto de ETL, los procesos que permiten precisamente obtener, procesar y cargar los datos desde un sistema a otro para conocer y dominar todas las tecnologías implicadas. Además aprenderemos a automatizar estos sistemas con un framework híbrido (cloud-local) basado en Python, uno de los lenguajes de programación por excelencia en el mundo del análisis de datos.

Issued on

October 19, 2024

Expires on

October 19, 2029