Introducción al Big Data y a la programación con PySpark

Aprende los fundamentos del Big Data, los retos que presenta y cómo se resuelven con una sesión práctica donde aprenderás a programar en PySpark, la tecnología esencial del Big Data.

DETALLES

Información del evento

Este evento es en exclusiva para los alumnos de Factoría F5.

Fecha

Diciembre 4, 2024 13:30

Duración

2 horas

Lugar

Sesión online

Dificultad

Principiante

OBJETIVO

¿Qué conseguirás?

El objetivo es introducirte en el mundo del Big Data explicando las bases teóricas y los retos que presenta, para luego entender cómo se resuelven de forma práctica aprendiendo a utilizar una de las tecnologías más demandadas en el mercado: PySpark.

 

CONTENIDOS

¿Qué vamos a ver?

Introducción al Big Data

Big Data vs Small Data, escalado vertical y horizontal, clústers, Map Reduce, Big Data en las empresas y ETLs.

Introducción a PySpark

Funciones básicas de PySpark, evaluación perezosa, particionado de datos, ejercicios y reto final.

Introducción a SparkSQL

Comparación entre PySpark y SparkSQL, introducción a Data Lakes, ventajas y desventajas, ejercicios y reto final.

REQUISITOS PREVIOS

¿Qué necesitarás?

Esta sesión combina teoría y práctica. Necesitarás:

  • Acceso a un Gmail o una cuenta de Google.
  • Conocimientos básicos de programación.
PREGUNTAS FRECUENTES

¿Tienes alguna pregunta?

VOLVER ARRIBA