Pablo Castelló Torregrosa
La proliferación exponencial de nuevos tipos de fuentes de datos y el ritmo de generación de los mismos son probablemente los factores clave detrás del auge de toda la innovación que conlleva el Big Data y el análisis de datos en general.
Por eso, como profesionales en este sector, no sólo es importante tener la capacidad de generar y entrenar modelos, sino aprender a desarrollar sistemas que puedan generar para nosotros nuestros propios sets de datos.
Sin embargo, aun teniendo acceso a cantidades brutales de datos, estos no siempre son ni fácilmente accesibles ni suelen estar en los formatos ni estándares de calidad que deseamos. Nuestra misión será dotarte de conocimientos y herramientas para poder afrontar estos escenarios con éxito.
En este curso vas a aprender a hacerlo cubriendo todo el ciclo de vida del dato y no sólo con un enfoque práctico, sino también usando fuentes y datos reales.
Conocerás y practicarás para dominar un montón de herramientas y tecnologías relacionadas con el mundo del manejo de datos, sobretodo en relación a la obtención, la transformación o manipulación y la carga de los mismos.
El curso se desarrolla sobre el concepto de ETL, los procesos que permiten precisamente obtener, procesar y cargar los datos desde un sistema a otro para conocer y dominar todas las tecnologías implicadas. Además aprenderemos a automatizar estos sistemas con un framework híbrido (cloud-local) basado en Python, uno de los lenguajes de programación por excelencia en el mundo del análisis de datos.
Issued on
October 19, 2024
Expires on
October 19, 2029