Python aplicado ao Machine Learning

Em pré-inscrição. Entre em contacto para obter mais informações.

50 horas | Nível: Intermédio

Apresentação

Esta formação tem como objectivo dotar os participantes de conhecimentos teóricos e práticos na área da aprendizagem automática, utilizando a linguagem Python e as suas principais bibliotecas. A formação permite compreender todo o ciclo de desenvolvimento de modelos de machine learning, desde a preparação de dados até à avaliação e implementação de soluções.

Enquadramento

O crescimento exponencial dos dados e a necessidade de extrair valor a partir dos mesmos têm impulsionado a adopção de técnicas de machine learning em diversas áreas. Python tornou-se a linguagem de referência neste domínio, suportando um vasto ecossistema de ferramentas. Este curso enquadra-se na necessidade de formar profissionais capazes de aplicar técnicas de análise e modelação de dados para suportar a tomada de decisão e desenvolver soluções inteligentes.

Destinatários

  • Programadores Python
  • Analistas de dados
  • Engenheiros de software
  • Profissionais de IT interessados em inteligência artificial
  • Estudantes e profissionais que pretendam iniciar-se em machine learning

Pré-requisitos

  • Conhecimentos de Python
  • Noções de análise de dados
  • Lógica de programação

Objectivo geral

Capacitar os participantes para desenvolver modelos de machine learning utilizando Python, aplicando técnicas de preparação de dados, treino, avaliação e optimização de modelos.

Objectivos específicos

No final da formação os formandos estarão capacitados para:

  • Compreender os conceitos fundamentais de machine learning
  • Utilizar bibliotecas essenciais como NumPy, Pandas e Scikit-Learn
  • Preparar e transformar dados para modelação
  • Aplicar técnicas de visualização para análise exploratória
  • Desenvolver modelos de classificação, regressão e clustering
  • Avaliar e optimizar modelos de machine learning
  • Introduzir conceitos de redes neurais com TensorFlow e Keras
  • Interpretar resultados e comunicar insights
  • Desenvolver projectos práticos de machine learning

Programa

1.  Introdução ao Python para Machine Learning

O que é Machine Learning e onde a linguagem Python se encaixa.

Ambientes de desenvolvimento recomendados: Jupyter Notebook, VS Code, Google Colab.

Principais bibliotecas para Machine Learning: visão geral das bibliotecas como NumPy, Pandas, Matplotlib, Scikit-Learn, TensorFlow, Keras e PyTorch.

2.  Manipulação de Dados com NumPy e Pandas

Introdução ao NumPy: Arrays, operações vetorizadas e manipulação de matrizes.

Workflow com dados em Pandas: DataFrames, Series, operações de limpeza e transformação de dados.

Preparação e pré-processamento de dados: manipulação de dados em falta, padronização, normalização, one-hot encoding.

3.  Visualização de Dados para Machine Learning

Introdução ao Matplotlib e Seaborn: Criação de gráficos básicos e avançados. Exploração de dados: Análise visual de padrões, correlações e insights.

Gráficos específicos para ML: Pair plots, heatmaps de correlação, histogramas e box plots.

4.  Introdução ao Scikit-Learn e Fluxo de Trabalho de Machine Learning

Fluxo de trabalho em ML com Scikit-Learn: Importação, pré-processamento, criação, treino e avaliação de modelos.

Separação de dados: Divisão entre dados de treino, validação e teste com train_test_split.

Escolha do modelo: Tipos de algoritmos e suas aplicações (classificação, regressão e clustering).

5.  Modelos de Classificação com Scikit-Learn

Algoritmos principais: Regressão Logística, K-Nearest Neighbors (KNN), Decision Trees, Random Forest e Support Vector Machine (SVM).

Construção, ajuste e avaliação de modelos de classificação.

Métricas de avaliação: Acurácia, precisão, recall, F1-score, matriz de confusão e curva ROC/AUC.

6.  Modelos de Regressão com Scikit-Learn

Algoritmos principais: Regressão Linear, Ridge, Lasso, e Regressão de Árvores de Decisão.

Construção e ajuste de modelos de regressão. Métricas de avaliação para regressão: RMSE, MAE, R².

7.  Introdução a Modelos de Clustering e Redução de Dimensionalidade

Clustering: K-Means, Hierarchical Clustering e DBSCAN.

Redução de dimensionalidade com PCA (Principal Component Analysis). Aplicações práticas: Segmentação de clientes, análise de componentes principais.

8.  Otimização de Modelos e Seleção de Hiperparâmetros

Técnicas de validação cruzada (Cross-Validation).

Otimização de hiperparâmetros com GridSearchCV e RandomizedSearchCV. Estratégias para evitar overfitting e underfitting.

9.  Introdução a Redes Neurais com TensorFlow e Keras

Fundamentos de redes neurais: Neurônios, camadas e funções de ativação.

Construção de modelos básicos com Keras: Modelo sequencial e definição de camadas.

Treino e avaliação de redes neurais simples: Forward pass, backpropagation, ajuste de hiperparâmetros.

10.  Avaliação e Interpretação de Modelos

Interpretação de modelos com SHAP e LIME: Explicabilidade dos modelos e importância de recursos.

Visualização de aprendizagem e ajuste de modelos: Learning curves e métricas de treino.

Relatórios e apresentação de resultados: Como comunicar insights de modelos ML.

11.  Prática de Implementação e Projetos de Machine Learning

Projeto 1: Classificação de imagens com Keras e CNNs. Projeto 2: Regressão com Scikit-Learn.

Projeto 3: Segmentação de clientes com clustering.

Projeto 4: Pipeline de ML completo para predição de churn com Scikit-Learn e Pandas.

Pedido de Informação