Procesamiento de datos con tecnologías Big Data
Curso
Virtual
Descripción
-
Tipología
Curso
-
Metodología
Virtual
-
Horas lectivas
32h
-
Clases virtuales
Sí
Este curso se diferencia de los cursos ofrecidos en el mercado debido a que aborda conceptos avanzados sobre la aplicación de tecnologías de Big Data en el ámbito del procesamiento de datos, conceptos como Lakehouses, Iceberg, Hudi, entre otros, los cuales son lo último a nivel de procesamientos de datos en Big Data en la industria. Otro aspecto fundamental es el aspecto práctico del cual carecen los demás programas, lo cual busca que los estudiantes no solo tengan un acercamiento real a la aplicación de soluciones de Big Data en procesamiento de datos, sino que también les permita conocer las mejores prácticas para poder generar valor dentro de sus organizaciones de la manera mas eficiente posible con sus grandes volúmenes de datos.
A tener en cuenta
Objetivo General
Permitir a los estudiantes adquirir conocimientos teóricos / prácticos sobre las últimas técnicas y paradigmas de procesamiento de datos en tecnologías de Big Data, donde tendrán un acercamiento a los conceptos de vanguardia como los son Lakehouses, Hudi, Iceberg, Delta, entre otros, como también los conceptos básicos relacionados al procesamiento de datos en Big Data con Spark y al almacenamiento en Big Data con tecnologías NoSQL.
Objetivos específicos
- Conocer los conceptos básicos relacionados al mundo de Big Data.
- Entender los conceptos y distintas tecnologías de almacenamiento NoSQL.
- Desarrollar capacidades de desarrollo de soluciones de datos con Spark.
- Adquirir las mejores prácticas de desarrollo de soluciones de Big Data con Spark.
- Entender los conceptos de los formatos de Big Data mas usados en la industrial como lo son Delta, Hudi e Iceberg.
El curso esta dirigido a personas con experiencia básica de ingeniería de datos, ciencia de datos, arquitectura de datos, ingeniería de software, o relacionados, que quieran aprender sobre las últimas técnicas y paradigmas de procesamiento de datos aplicados a través de tecnologías de Big Data. Como también aquellas personas que quieran entender la actualidad del Big Data en términos de procesos, arquitecturas, tecnologías y paradigmas.
La Pontificia Universidad Javeriana otorgará certificado de asistencia a quienes hayan cumplido con el 80% de la asistencia a las sesiones programadas.
Opiniones
Logros de este Centro
Todos los cursos están actualizados
La valoración media es superior a 3,7
Más de 50 opiniones en los últimos 12 meses
Este centro lleva 16 años en Emagister.
Materias
- Introducción al big data
- Conceptos del big data
- Tecnologías en Big Data
- Archivos en Big Data
- Almacenamiento en Big Data
- Procesamiento de datos
- Transformaciones con Spark
Programa académico
Introducción al Big Data.
- Conceptos generales de Big Data.
- Arquitectura, motivadores y tecnologías en Big Data.
Almacenamiento y archivos en Big Data.
- Conceptos de base de datos NoSQL.
- Conceptos de bodegas de datos, lagos de datos y lakehouses.
- Conceptos de formatos de Big Data (Parquet, Hudi, Icerber, etc).
- Talleres aplicados de bases NoSQL y formatos de Big Data.
Procesamiento de datos en Big Data.
- Conceptos básicos de Spark.
- SparkSQL y operaciones.
- Transformaciones con Spark.
- Monitoreo y rendimientos de clusters en Spark
- Mejores prácticas del uso de Spark.
- Talleres aplicados de Spark.
Procesamiento de datos con tecnologías Big Data
