Introducción al Big Data y a la programación con PySpark
Aprende los fundamentos del Big Data, los retos que presenta y cómo se resuelven con una sesión práctica donde aprenderás a programar en PySpark, la tecnología esencial del Big Data.
DETALLES
Información del evento
Este evento es en exclusiva para los alumnos de Factoría F5.

Fecha
Diciembre 4, 2024 13:30

Duración
2 horas

Lugar
Sesión online

Dificultad
Principiante

OBJETIVO
¿Qué conseguirás?
El objetivo es introducirte en el mundo del Big Data explicando las bases teóricas y los retos que presenta, para luego entender cómo se resuelven de forma práctica aprendiendo a utilizar una de las tecnologías más demandadas en el mercado: PySpark.
CONTENIDOS
¿Qué vamos a ver?

Introducción al Big Data
Big Data vs Small Data, escalado vertical y horizontal, clústers, Map Reduce, Big Data en las empresas y ETLs.

Introducción a PySpark
Funciones básicas de PySpark, evaluación perezosa, particionado de datos, ejercicios y reto final.

Introducción a SparkSQL
Comparación entre PySpark y SparkSQL, introducción a Data Lakes, ventajas y desventajas, ejercicios y reto final.
REQUISITOS PREVIOS
¿Qué necesitarás?
Esta sesión combina teoría y práctica. Necesitarás:
- Acceso a un Gmail o una cuenta de Google.
- Conocimientos básicos de programación.
