Atividade

109314 - Ciência de Dados, Aprendizado de Máquina e Mineração de Dados

Período da turma: 29/07/2023 a 08/09/2023

Selecione um horário para exibir no calendário:
 
 
Descrição: Objetivos
Apresentar ao aluno técnicas e aplicações de ciência de dados, aprendizado de máquina e mineração de dados, na fronteira do conhecimento, abordando questões atuais, mais especificamente, preparação e análise dos dados, interpretação de resultados, sistemas de recomendação e mineração de dados sociais, com exemplos de aplicações, possibilitando o uso dessa tecnologia na solução de problemas e na tomada de decisão.
Justificativa
A área de engenharia de dados, em suas mais variadas frentes, tem tido grande relevância frente aos desafios de se gerenciar e processar a grande quantidade de dados disponíveis, principalmente online, tanto dados estruturados quanto não estruturados. Dominar os conceitos e os métodos automáticos existentes para extração de conhecimento é essencial para o real proveito dos dados disponíveis, quer de uso geral, quer de domínios especializados.
Conteúdo
Serão apresentadas técnicas para exploração de dados (Dados univariados; Dados multivariados; Visualização: histograma, boxplot e scatterplot), pre-processamento de dados (limpeza dos dados, transformação, redução de dimensionalidade e dados desbalanceados). Paradigmas de Aprendizado e Regressão linear e multivariada.. Modelos preditivos. Análise de experimentos: uso de métricas de avaliação, matriz de confusão e curva ROC. Critérios de distância: Aprendizado baseado em instâncias. 1-vizinho mais
próximo. Medidas de distância. Similaridade e dissimilaridade. Proximidade. algoritmo KNN.

Bibliografia básica
Mello, R.F.; Ponti, M.A. Machine Learning: a practical approach on the statistical learning theory. Springer, 2018.
Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021.
Jurafsky, D. and Martin, J.H. (2009). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Prentice Hall.
Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers.
Rezende, S.O. (org.) (2003). Sistemas Inteligentes: Fundamentos e Aplicações. Editora Manole.
Witten, I.H.; Frank, E.; Hall, M.A. (2011). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.
Tan, P.N.; Steinbach, M.; Karpatne, A.; Kumar, V. (2016). Introduction to Data Mining (2nd Edition). Pearson.
Zaki, M. J., & Meira Jr, W. (2020). Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Cambridge University Press

Carga Horária:

40 horas
Tipo: Obrigatória
Vagas oferecidas: 245
 
Ministrantes: Ricardo Marcondes Marcacini
Roseli Aparecida Francelin Romero


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP