Python aplicado ao Machine Learning

50 horas | Nível: Intermédio

Apresentação

Esta formação tem como objectivo dotar os participantes de conhecimentos teóricos e práticos na área da aprendizagem automática, utilizando a linguagem Python e as suas principais bibliotecas. A formação permite compreender todo o ciclo de desenvolvimento de modelos de machine learning, desde a preparação de dados até à avaliação e implementação de soluções.

Enquadramento

O crescimento exponencial dos dados e a necessidade de extrair valor a partir dos mesmos têm impulsionado a adopção de técnicas de machine learning em diversas áreas. Python tornou-se a linguagem de referência neste domínio, suportando um vasto ecossistema de ferramentas. Este curso enquadra-se na necessidade de formar profissionais capazes de aplicar técnicas de análise e modelação de dados para suportar a tomada de decisão e desenvolver soluções inteligentes.

Destinatários

Programadores Python
Analistas de dados
Engenheiros de software
Profissionais de IT interessados em inteligência artificial
Estudantes e profissionais que pretendam iniciar-se em machine learning

Pré-requisitos

Conhecimentos de Python
Noções de análise de dados
Lógica de programação

Objectivo geral

Capacitar os participantes para desenvolver modelos de machine learning utilizando Python, aplicando técnicas de preparação de dados, treino, avaliação e optimização de modelos.

Objectivos específicos

No final da formação os formandos estarão capacitados para:

Compreender os conceitos fundamentais de machine learning
Utilizar bibliotecas essenciais como NumPy, Pandas e Scikit-Learn
Preparar e transformar dados para modelação
Aplicar técnicas de visualização para análise exploratória
Desenvolver modelos de classificação, regressão e clustering
Avaliar e optimizar modelos de machine learning
Introduzir conceitos de redes neurais com TensorFlow e Keras
Interpretar resultados e comunicar insights
Desenvolver projectos práticos de machine learning

Programa

1. Introdução ao Python para Machine Learning

O que é Machine Learning e onde a linguagem Python se encaixa.

Ambientes de desenvolvimento recomendados: Jupyter Notebook, VS Code, Google Colab.

Principais bibliotecas para Machine Learning: visão geral das bibliotecas como NumPy, Pandas, Matplotlib, Scikit-Learn, TensorFlow, Keras e PyTorch.

2. Manipulação de Dados com NumPy e Pandas

Introdução ao NumPy: Arrays, operações vetorizadas e manipulação de matrizes.

Workflow com dados em Pandas: DataFrames, Series, operações de limpeza e transformação de dados.

Preparação e pré-processamento de dados: manipulação de dados em falta, padronização, normalização, one-hot encoding.

3. Visualização de Dados para Machine Learning

Introdução ao Matplotlib e Seaborn: Criação de gráficos básicos e avançados. Exploração de dados: Análise visual de padrões, correlações e insights.

Gráficos específicos para ML: Pair plots, heatmaps de correlação, histogramas e box plots.

4. Introdução ao Scikit-Learn e Fluxo de Trabalho de Machine Learning

Fluxo de trabalho em ML com Scikit-Learn: Importação, pré-processamento, criação, treino e avaliação de modelos.

Separação de dados: Divisão entre dados de treino, validação e teste com train_test_split.

Escolha do modelo: Tipos de algoritmos e suas aplicações (classificação, regressão e clustering).

5. Modelos de Classificação com Scikit-Learn

Algoritmos principais: Regressão Logística, K-Nearest Neighbors (KNN), Decision Trees, Random Forest e Support Vector Machine (SVM).

Construção, ajuste e avaliação de modelos de classificação.

Métricas de avaliação: Acurácia, precisão, recall, F1-score, matriz de confusão e curva ROC/AUC.

6. Modelos de Regressão com Scikit-Learn

Algoritmos principais: Regressão Linear, Ridge, Lasso, e Regressão de Árvores de Decisão.

Construção e ajuste de modelos de regressão. Métricas de avaliação para regressão: RMSE, MAE, R².

7. Introdução a Modelos de Clustering e Redução de Dimensionalidade

Clustering: K-Means, Hierarchical Clustering e DBSCAN.

Redução de dimensionalidade com PCA (Principal Component Analysis). Aplicações práticas: Segmentação de clientes, análise de componentes principais.

8. Otimização de Modelos e Seleção de Hiperparâmetros

Técnicas de validação cruzada (Cross-Validation).

Otimização de hiperparâmetros com GridSearchCV e RandomizedSearchCV. Estratégias para evitar overfitting e underfitting.

9. Introdução a Redes Neurais com TensorFlow e Keras

Fundamentos de redes neurais: Neurônios, camadas e funções de ativação.

Construção de modelos básicos com Keras: Modelo sequencial e definição de camadas.

Treino e avaliação de redes neurais simples: Forward pass, backpropagation, ajuste de hiperparâmetros.

10. Avaliação e Interpretação de Modelos

Interpretação de modelos com SHAP e LIME: Explicabilidade dos modelos e importância de recursos.

Visualização de aprendizagem e ajuste de modelos: Learning curves e métricas de treino.

Relatórios e apresentação de resultados: Como comunicar insights de modelos ML.

11. Prática de Implementação e Projetos de Machine Learning

Projeto 1: Classificação de imagens com Keras e CNNs. Projeto 2: Regressão com Scikit-Learn.

Projeto 3: Segmentação de clientes com clustering.

Projeto 4: Pipeline de ML completo para predição de churn com Scikit-Learn e Pandas.

catálogo de formação