Este curso avançado destina-se a profissionais que já dominam os fundamentos de Python e Pandas e que pretendem evoluir para técnicas avançadas de manipulação de dados, processamento em larga escala com PySpark e desenvolvimento de análises em contextos de Big Data.
À medida que os conjuntos de dados crescem em volume, velocidade e variedade, torna-se essencial o domínio de ferramentas escaláveis como PySpark. Este curso prepara os formandos para enfrentar desafios de análise de dados em grande escala, combinando a profundidade do Pandas com a performance do PySpark.
Capacitar os participantes para manipular e analisar dados em grande escala, utilizando técnicas avançadas de Pandas e os recursos do PySpark.
No final do curso, os participantes deverão ser capazes de:
Módulo 1 – Avançado em Pandas (6h)
Módulo 2 – PySpark Essentials (6h)
Módulo 3 – Estudo de Caso Final (4h)