| 136322 - Técnicas Avançadas de Captura e Tratamento de Dados |
| Período da turma: | 11/04/2026 a 13/06/2026
|
||||
|
|
|||||
| Descrição: | Objetivos:
Fornecer conhecimento em técnicas avançadas de captura e tratamento de dados, técnicas de tratamento de dados, outliers, dados faltantes. Extração de texto a partir de imagens, redução de dimensionalidade, web scraping. Introdução ao processamento de linguagem natural. Ementa: 1. Dados estruturados e não estruturados e seus problemas típicos 2. Técnicas para tratamento e limpeza de bases de dados: valores faltantes, outliers, valores errôneos, redundância e desbalanceamento 3. Pré-processamento de dados: normalização, transformação, discretização e codificação de variáveis categóricas 4. Extração de texto a partir de imagens - OCR 5. Redução de dimensionalidade: análise de componentes principais 6. Introdução ao processamento de linguagem natural: Matriz documentos/palavras e aplicações 7. Extração de características de sinais e images e aplicações 8. Web scraping Referências: 1. Forbellone, André Luiz Villar. Lógica de programação: a construção de algoritmos e estruturas de dados. São Paulo, SP : Makron, 1993. 2. S. Vajjala, B. Majumder, A. Gupta, H. Surana. Practical Natural Language Processing: A Comprehensive Guide to Building Real-World NLP Systems, O'Reilly, 2020 3. Trevor Hastie, Robert Tibshirani, Jerome Friedman. The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer, 2009. 4. Rodrigo F. Mello and Moacir A Ponti (2018). Machine Learning: a practical approach on the statistical learning theory. Springer. 5. Katti Faceli; Ana Carolina Lorena; João Gama; André C.P.L.F. Carvalho. Inteligência Artificial: uma abordagem de aprendizado de máquina, 2011. Capítulo 3 6. Varun Chandola; Arindam Banerjee; Vipin Kumar. Outlier detection: a survey. ACM Computing Surveys, v. 14, p. 15, 2007. |
||||
| Carga Horária: |
40 horas |
||||
| Tipo: | Obrigatória | ||||
| Vagas oferecidas: | 320 | ||||
| Ministrantes: |
Luis Gustavo Nonato Moacir Antonelli Ponti |
|
Créditos © 1999 - 2025 - Superintendência de Tecnologia da Informação/USP |