Atividade

121573 - Inteligência Analítica usando Mineração de Textos

Período da turma: 24/05/2025 a 20/06/2025

Selecione um horário para exibir no calendário:
 
 
Descrição: Objetivos:

O curso visa prover teoria e prática sobre mineração de textos aplicada para inteligência analítica, a fim de que os alunos possam aplicar as novas técnicas e ferramentas estudadas em problemas reais. No contexto de inteligência analítica, a mineração de textos visa aplicar um conjunto de técnicas e processos para aprender padrões a partir grandes corpus textuais, em que os padrões são convertidos para geração de indicadores. Os indicadores são sumarizados por meio de estatística descritiva, desde gráficos simples para geração de dashboards até a visualização de modelos descritivos e preditivos, como clustering, classificação e regressão. Para isso, serão abordadas técnicas para extração de tópicos em textos, análise de sentimentos, extração de informação temporal, informação geográfica, e outros tipos de entidades. Será abordado o processo que envolve o pré-processamento e representação do conhecimento (aprendizado de representações e text embedding), extração de padrões (métodos de agrupamento, classificação e regressão) e pós-processamento (construção de indicadores para inteligência analítica).

Justificativa:

A quantidade de textos gerados por diferentes fontes tem crescido em escalas cada vez maiores, devido à popularização de portais de notícias, fóruns e redes sociais. A necessidade de analisar esses textos de forma automática e as dificuldades encontradas nesta análise têm levado à necessidade do desenvolvimento de novos métodos que possam lidar com os vários problemas associados à análise de textos. Este curso irá apresentar ao aluno os princípios gerais da mineração de textos, com forte fundamento em técnicas de pré-processamento e estruturação de dados textuais, até métodos de extração de padrões, avaliação e uso do conhecimento gerado. Em especial, esse curso instancia o processo de mineração de textos com foco em inteligência analítica, que envolve a construção de indicadores e sua visualização por meio de dashboards para apoiar tomada de decisão. Esse aspecto torna o curso prática e útil para profissionais da área.

Conteúdo:

O objetivo desta disciplina é explorar os conceitos, técnicas e aplicações envolvidas na mineração de dados textuais para Inteligência Analítica.

Principais tópicos:

Parte I - Fundamentos da Mineração de Textos: Identificação do problema; pré-processamento de dados textuais; extração de padrões, pós-processamento e uso do conhecimento.
Aplicação 1 - Help Desk: Organizando automaticamente mensagens dos clientes usando representações clássicas baseadas em modelo espaço-vetorial.

Parte II - Aprendizado de representações e word embeddings, modelos de linguagem, extração de informação de textos.
Aplicação 2 - Meu próprio Buscador: Localizando documentos similares usando word embeddings.

Parte III - Extração de Informação Geográfica, Geoparsing e Geocoding.
Aplicação 3 - Mapas de Calor: Onde estão as reviews positivas e negativas?

Parte IV - Modelagem de Tópicos e sua Evolução Temporal
Aplicação 4 - Séries Temporais: tendência e sazonalidade de tópicos.


Bibliografia:
Han, J., Pei, J., & Tong, H. (2022). Data mining: concepts and techniques. Morgan kaufmann, Fourth Edition.
Mitchell, T. M. (1997). Machine Learning. McGraw-Hill. Alpaydin, E. (2004). Introduction to Machine Learning. MIT Press.
Rezende, S. O. (2003). Sistemas inteligentes: fundamentos e aplicações. Editora Manole Ltda.
Aggarwal, C. C., & Zhai, C. (Eds.). (2012). Mining text data. Springer Science & Business Media.
Provost, F.; Fawcett, T. Data Science for Business: What you need to know about data mining and data analytics thinking by O'Reilly Media, 2013.
Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021.
Zong, C., Xia, R., & Zhang, J. (2021). Text Data Mining (Vol. 711, p. 712). Singapore: Springer.
Aggarwal, C. C. (2018). Machine learning for text. Cham: Springer International Publishing.
M. J. Zaki and W. Meira - Data Mining and Machine Learning: Fundamental Concepts and Algorithms, 2'Ed: Cambridge University Press, 2020.
Artigos recentes dos periódicos Information Sciences Journal, Neural Networks, Neurocomputing, Machine Learning, Applied Intelligence, Journal of Machine Learning Research, Intelligent Data Analysis, Physical Review e outros, bem como de conferências importantes da área.

Carga Horária:

20 horas
Tipo: Optativa
Vagas oferecidas: 270
 
Ministrantes: Diego Furtado Silva
Ricardo Marcondes Marcacini
Solange Oliveira Rezende


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP