127109 - Ciência de Dados, Aprendizado de Máquina e Mineração de Dados |
Período da turma: | 02/08/2025 a 12/09/2025
|
||||
|
|||||
Descrição: | Objetivos
Apresentar ao aluno técnicas e aplicações de ciência de dados, aprendizado de máquina e mineração de dados, na fronteira do conhecimento, abordando questões atuais, mais especificamente, preparação e análise dos dados, interpretação de resultados, sistemas de recomendação e mineração de dados sociais, com exemplos de aplicações, possibilitando o uso dessa tecnologia na solução de problemas e na tomada de decisão. Justificativa A área de engenharia de dados, em suas mais variadas frentes, tem tido grande relevância frente aos desafios de se gerenciar e processar a grande quantidade de dados disponíveis, principalmente online, tanto dados estruturados quanto não estruturados. Dominar os conceitos e os métodos automáticos existentes para extração de conhecimento é essencial para o real proveito dos dados disponíveis, quer de uso geral, quer de domínios especializados. Conteúdo Parte 1: Exploração de dados (Dados univariados; Dados multivariados; Visualização: histograma, boxplot e scatterplot), Pre-processamento de dados (limpeza dos dados, transformação, redução de dimensionalidade e dados desbalanceados). Aplicação 1 e Aplicação 2 Parte 2: Paradigmas de Aprendizado e Regressão linear, multivariada e logística. Medidas de Avaliação. Modelos preditivos. Análise de experimentos: uso de métricas de avaliação, matriz de confusão e curva ROC. Aplicação 3 Parte 3: Métodos de Aprendizado para Classificação e Regressão: árvores de decisão, comitê de classificadores, random forest, SVM, XGBoost, LGBM. Aplicação 4 Parte 4: Mineração de Dados. Introdução e Conceitos Básicos. Parte 5: Extração de Padrões com Agrupamento de Dados: Medidas de distância. Algoritmo KNN. Método Particional, Hierárquico e baseado em Densidade. Medidas de Avaliação. Aplicação 5 Parte 6: Extração de Padrões com Regras de Associação. Aplicação 6 Parte 7: Extração de Padrões em Grandes Bases de Dados e Escalabilidade. Aplicação 7. Bibliografia básica Mello, R.F.; Ponti, M.A. Machine Learning: a practical approach on the statistical learning theory. Springer, 2018. Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021. Jurafsky, D. and Martin, J.H. (2009). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall. Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers. Rezende, S.O. (org.) (2003). Sistemas Inteligentes: Fundamentos e Aplicações. Editora Manole. Witten, I.H.; Frank, E.; Hall, M.A. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann. Tan, P.N.; Steinbach, M.; Karpatne, A.; Kumar, V. (2016). Introduction to Data Mining (2nd Edition). Pearson. Zaki, M. J., & Meira Jr, W. (2020). Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Cambridge University Press HAN, Jiawei; PEI, Jian; TONG, Hanghang. Data mining: concepts and techniques. Morgan kaufmann, 4th edition, 2022. |
||||
Carga Horária: |
40 horas |
||||
Tipo: | Obrigatória | ||||
Vagas oferecidas: | 320 | ||||
Ministrantes: |
Ricardo Marcondes Marcacini Roseli Aparecida Francelin Romero |
![]() |
Créditos © 1999 - 2025 - Superintendência de Tecnologia da Informação/USP |