
98217 - Módulo Exploratory Analytics, Predictive Analytics & Machine Learning

Período da turma: 01/11/2022 a 23/05/2023

Programa completo com ementa e referência bibliográfica:

Disciplina: Estruturas de Bancos de Dados, Tipos de Variáveis e Escalas de Mensuração
Ementa: Bancos de Dados; observações e variáveis; estruturas longitudinais e transversais; variáveis qualitativas e quantitativas; escalas de mensuração de variáveis; variáveis nominais e ordinais; variáveis métricas.

Disciplina: Introdução ao Machine Learning
Ementa: Machine learning e reconhecimento de padrões; conceito de supervisão e não supervisão; técnicas não supervisionadas e relação com escalas de mensuração de variáveis; técnicas supervisionadas e relação com escalas de mensuração de variáveis; casos reais e práticos.

Disciplina: Unsupervised Machine Learning & Exploratory Analytics - Análise de Clusters
Ementa: Análise de conglomerados e de agrupamentos; padronização de variáveis e procedimento z-scores; medidas de distância e de similaridade; clusters hierárquicos; clusters não hierárquicos k-means; esquemas de aglomeração; dendrograma; escalonamento multidimensional; aplicações de bancos de dados reais de mercado em R ou Python.

Disciplina: Unsupervised Machine Learning & Exploratory Analytics - Análise Fatorial e PCA
Ementa: Análise fatorial; principal componente analysis (PCA); construção de fatores; matriz de correlações; escores e cargas fatoriais; mapa de cargas; criação de rankings em datasets; aplicações de bancos de dados reais de mercado em R ou Python.

Disciplina: Unsupervised Machine Learning & Exploratory Analytics - Análise de Correspondência Simples e Múltipla
Ementa: Tabelas de frequência; massas de frequências; resíduos frequentistas; teste chi-quadrado; associação entre variáveis e entre categorias; coordenadas de categorias e mapas perceptuais; clusterização e rankings de observações a partir de variáveis qualitativas; aplicações de bancos de dados reais de mercado em R ou Python.

Disciplina: Supervised Machine Learning & Predictive Analytics - Análise de Regressão Simples e Múltipla
Ementa: Mapa de correlações; modelos de regressão simples; estimação por mínimos quadrados; coeficiente de ajuste R²; teste F, testes t, modelos de regressão múltipla; procedimento Stepwise; multicolinearidade; teste de Shapiro-Francia; procedimento de Box-Cox; modelos não lineares; intervalos de confiança e previsão; aplicações de bancos de dados reais de mercado em Excel e em R ou Python.

Disciplina: Supervised Machine Learning & Predictive Analytics - Modelos Logísticos Binários e Multinomiais
Ementa: Conceitos de probabilidade e chance de ocorrência de eventos; curva sigmoide S e modelo probabilístico; estimação por máxima verossimilhança; modelos de risco de crédito e de probabilidade de default; intervalos de confiança e previsão; conceito de cutoff; confusion matrix; análise de sensibilidade; indicadores de acurácia, sensitividade e especificidade; curva ROC; índice GINI; modelos multinomiais; curvas spline; aplicações de bancos de dados reais de mercado em Excel e em R ou Python.

Disciplina: Supervised Machine Learning & Predictive Analytics - Modelos para Dados de Contagem
Ementa: Dados de contagem; conceito de exposição; estimação por máxima verossimilhança; modelo Poisson; overdispersion; modelo binomial negativo; teste de Cameron e Trivedi; intervalos de confiança e previsão; aplicações de bancos de dados reais de mercado em Excel e em R ou Python.

Disciplina: Outros Modelos de Machine Learning
Ementa: Árvores de decisão; bagging, boosting; random forest; redes neurais; técnicas de validação; treino, validação e teste, out-of-time, validação cruzada; aplicações de bancos de dados reais de mercado em R ou Python.

Disciplina: Business Intelligence e Data Visualization
Ementa: Business Intelligence; conexão a dados; simplificação e classificação de dados; organização de dados; segmentação de dados por data; utilização de diversas medidas em uma exibição; relação entre valores numéricos; mapeamento de dados geograficamente; exibição de valores específicos; personalização de dados; análise de dados a partir de cálculos rápidos provenientes de tabelas; exibição de partes de um todo; destaque de dados com linhas de referência; disponibilização de exibições; aplicações de bancos de dados reais de mercado em Tableau Desktop.

Tópicos Especiais:
Avaliações, atividades complementares, trabalhos em grupo e interação. Realização das Provas EaD: as provas são disponibilizadas no dia seguinte a aula ao vivo. Atividades complementares: slides das aulas, material de leitura pré e pós-aula, bibliografia indicada, eventos, reportagens, artigos, entre outros. Esclarecimento de dúvidas via e-mail após as aulas ao vivo: caso os alunos ainda tenham dúvidas após a aula ministrada, estas serão encaminhadas para o professor e as respostas serão compartilhadas com os alunos pela intranet. Interação em aula (trabalhos em grupo): durante a aula ao vivo serão utilizadas as ferramentas TalkShow, Zoom, Wooclap e outros de interação, para desenvolvimento e apresentação de trabalhos em grupo, sanar dúvidas com professor, compartilhar experiências com a turma, responder a enquetes que ajudam na fixação do conteúdo, entre outros. Chat: ferramenta do sistema acadêmico utilizada durante as aulas ao vivo para que os alunos enviem as dúvidas ao professor. O histórico do chat fica disponível nos materiais da aula após o término da aula ao vivo. Conteúdo de intervalo: programa exibido nos intervalos das aulas (2 intervalos de 15 minutos), com temas relacionados ao curso.

118 horas
Tipo: Obrigatória
Vagas oferecidas: 5200
Ministrantes: Fabiano Guasti Lima
Helder Prado Santos
Henrique Rozenfeld
Luiz Paulo Lopes Favero
Marcos Roberto Luppe
Wilson Tarantin Júnior


