Este curso encontra-se projectado para data scientist, analistas e programadores que procuram construir e implementar modelos de Machine Learning utilizando Python. O curso abrange as principais bibliotecas, frameworks e fluxos de trabalho utilizados na criação, treino e avaliação de modelos preditivos e inteligentes.
O que é Machine Learning e onde a linguagem Python se encaixa.
Ambientes de desenvolvimento recomendados: Jupyter Notebook, VS Code, Google Colab.
Principais bibliotecas para Machine Learning: visão geral das bibliotecas como NumPy, Pandas, Matplotlib, Scikit-Learn, TensorFlow, Keras e PyTorch.
Introdução ao NumPy: Arrays, operações vetorizadas e manipulação de matrizes.
Workflow com dados em Pandas: DataFrames, Series, operações de limpeza e transformação de dados.
Preparação e pré-processamento de dados: manipulação de dados em falta, padronização, normalização, one-hot encoding.
Introdução ao Matplotlib e Seaborn: Criação de gráficos básicos e avançados. Exploração de dados: Análise visual de padrões, correlações e insights.
Gráficos específicos para ML: Pair plots, heatmaps de correlação, histogramas e box plots.
Fluxo de trabalho em ML com Scikit-Learn: Importação, pré-processamento, criação, treino e avaliação de modelos.
Separação de dados: Divisão entre dados de treino, validação e teste com train_test_split.
Escolha do modelo: Tipos de algoritmos e suas aplicações (classificação, regressão e clustering).
Algoritmos principais: Regressão Logística, K-Nearest Neighbors (KNN), Decision Trees, Random Forest e Support Vector Machine (SVM).
Construção, ajuste e avaliação de modelos de classificação.
Métricas de avaliação: Acurácia, precisão, recall, F1-score, matriz de confusão e curva ROC/AUC.
Algoritmos principais: Regressão Linear, Ridge, Lasso, e Regressão de Árvores de Decisão.
Construção e ajuste de modelos de regressão. Métricas de avaliação para regressão: RMSE, MAE, R².
Clustering: K-Means, Hierarchical Clustering e DBSCAN.
Redução de dimensionalidade com PCA (Principal Component Analysis). Aplicações práticas: Segmentação de clientes, análise de componentes principais.
Técnicas de validação cruzada (Cross-Validation).
Otimização de hiperparâmetros com GridSearchCV e RandomizedSearchCV. Estratégias para evitar overfitting e underfitting.
Fundamentos de redes neurais: Neurônios, camadas e funções de ativação.
Construção de modelos básicos com Keras: Modelo sequencial e definição de camadas.
Treino e avaliação de redes neurais simples: Forward pass, backpropagation, ajuste de hiperparâmetros.
Interpretação de modelos com SHAP e LIME: Explicabilidade dos modelos e importância de recursos.
Visualização de aprendizagem e ajuste de modelos: Learning curves e métricas de treino.
Relatórios e apresentação de resultados: Como comunicar insights de modelos ML.
Projeto 1: Classificação de imagens com Keras e CNNs. Projeto 2: Regressão com Scikit-Learn.
Projeto 3: Segmentação de clientes com clustering.
Projeto 4: Pipeline de ML completo para predição de churn com Scikit-Learn e Pandas.