Atividade

121568 - Ciência de Dados, Aprendizado de Máquina e Mineração de Dados

Período da turma: 03/08/2024 a 13/09/2024

Selecione um horário para exibir no calendário:
 
 
Descrição: Objetivos
Apresentar ao aluno técnicas e aplicações de ciência de dados, aprendizado de máquina e mineração de dados, na fronteira do conhecimento, abordando questões atuais, mais especificamente, preparação e análise dos dados, interpretação de resultados, sistemas de recomendação e mineração de dados sociais, com exemplos de aplicações, possibilitando o uso dessa tecnologia na solução de problemas e na tomada de decisão.

Justificativa
A área de engenharia de dados, em suas mais variadas frentes, tem tido grande relevância frente aos desafios de se gerenciar e processar a grande quantidade de dados disponíveis, principalmente online, tanto dados estruturados quanto não estruturados. Dominar os conceitos e os métodos automáticos existentes para extração de conhecimento é essencial para o real proveito dos dados disponíveis, quer de uso geral, quer de domínios especializados.

Conteúdo
Parte 1: Exploração de dados (Dados univariados; Dados multivariados; Visualização: histograma, boxplot e scatterplot), Pre-processamento de dados (limpeza dos dados, transformação, redução de dimensionalidade e dados desbalanceados). Aplicação 1 e Aplicação 2
Parte 2: Paradigmas de Aprendizado e Regressão linear, multivariada e logística. Medidas de Avaliação. Modelos preditivos. Análise de experimentos: uso de métricas de avaliação, matriz de confusão e curva ROC. Aplicação 3
Parte 3: Métodos de Aprendizado para Classificação e Regressão: árvores de decisão, comitê de classificadores, random forest, SVM, XGBoost, LGBM. Aplicação 4
Parte 4: Mineração de Dados. Introdução e Conceitos Básicos.
Parte 5: Extração de Padrões com Agrupamento de Dados: Medidas de distância. Algoritmo KNN. Método Particional, Hierárquico e baseado em Densidade. Medidas de Avaliação. Aplicação 5
Parte 6: Extração de Padrões com Regras de Associação. Aplicação 6
Parte 7: Extração de Padrões em Grandes Bases de Dados e Escalabilidade. Aplicação 7.

Bibliografia básica
Mello, R.F.; Ponti, M.A. Machine Learning: a practical approach on the statistical learning theory. Springer, 2018.
Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021.
Jurafsky, D. and Martin, J.H. (2009). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall.
Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers.
Rezende, S.O. (org.) (2003). Sistemas Inteligentes: Fundamentos e Aplicações. Editora Manole.

Witten, I.H.; Frank, E.; Hall, M.A. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.
Tan, P.N.; Steinbach, M.; Karpatne, A.; Kumar, V. (2016). Introduction to Data Mining (2nd Edition). Pearson.
Zaki, M. J., & Meira Jr, W. (2020). Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Cambridge University Press
HAN, Jiawei; PEI, Jian; TONG, Hanghang. Data mining: concepts and techniques. Morgan kaufmann, 4th edition, 2022.

Carga Horária:

40 horas
Tipo: Obrigatória
Vagas oferecidas: 270
 
Ministrantes: Ricardo Marcondes Marcacini
Roseli Aparecida Francelin Romero


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP