Atividade

109318 - Inteligência Analítica usando Mineração de Textos

Período da turma: 25/05/2024 a 21/06/2024

Selecione um horário para exibir no calendário:
 
 
Descrição: Objetivos:

O curso visa prover teoria e prática sobre mineração de textos aplicada para inteligência analítica, a fim de que os alunos possam aplicar as novas técnicas e ferramentas estudadas em problemas reais. No contexto de inteligência analítica, a mineração de textos visa aplicar um conjunto de técnicas e processos para aprender padrões a partir grandes corpus textuais, em que os padrões são convertidos para geração de indicadores. Os indicadores são sumarizados por meio de estatística descritiva, desde gráficos simples para geração de dashboards até a visualização de modelos descritivos e preditivos, como clustering, classificação e regressão. Para isso, serão abordadas técnicas para extração de tópicos em textos, análise de sentimentos, extração de informação temporal, informação geográfica, e outros tipos de entidades. Será abordado o processo que envolve o pré-processamento e representação do conhecimento (aprendizado de representações e text embedding), extração de padrões (métodos de agrupamento, classificação e regressão) e pós-processamento (construção de indicadores para inteligência analítica).

Justificativa:

A quantidade de textos gerados por diferentes fontes tem crescido em escalas cada vez maiores, devido à popularização de portais de notícias, fóruns e redes sociais. A necessidade de analisar esses textos de forma automática e as dificuldades encontradas nesta análise têm levado à necessidade do desenvolvimento de novos métodos que possam lidar com os vários problemas associados à análise de textos. Este curso irá apresentar ao aluno os princípios gerais da mineração de textos, com forte fundamento em técnicas de pré-processamento e estruturação de dados textuais, até métodos de extração de padrões, avaliação e uso do conhecimento gerado. Em especial, esse curso instância o processo de mineração de textos com foco em inteligência analítica, que envolve a construção de indicadores e sua visualização por meio de dashboards para apoiar tomada de decisão. Esse aspecto torna o curso prática e útil para profissionais da área. Além disso, diferentes métodos de extração de padrões são explorados ao longo do curso, como classificação supervisionada e semissupervisionada, agrupamento de textos, análise de sentimentos, aprendizado em grafos e visualização.

Conteúdo:
O objetivo desta disciplina é explorar os conceitos, técnicas e aplicações envolvidas na mineração de dados textuais para Inteligência analítica.

Principais tópicos:

Parte I - Fundamentos da Mineração de Textos: Identificação de problemas; pré-processamento de dados textuais; extração de padrões e pós-processamento.
Parte II - Tópicos em pré-processamento de textos: Representações clássicas baseadas em modelo espaço-vetorial, aprendizado de representações e word embeddings, modelos de linguagem, extração de informação de textos.
Parte III - Tópicos em extração de padrões: agrupamento particional e hierárquico de textos, extração de tópicos, classificação de textos, aprendizado em grafos e análise de sentimentos.
Parte IV - Tópicos em inteligência analítica: construção de indicadores a partir de textos, visualização de dados temporais, visualização de tópicos, visualização de dados relacionais, mapas de calor, interpretabilidade e análise de modelos.

Bibliografia:
Han, J., Pei, J., & Tong, H. (2022). Data mining: concepts and techniques. Morgan kaufmann, Fourth Edition.
Mitchell, T. M. (1997). Machine Learning. McGraw-Hill. Alpaydin, E. (2004). Introduction to Machine Learning. MIT Press.

Rezende, S. O. (2003). Sistemas inteligentes: fundamentos e aplicações. Editora Manole Ltda.

Aggarwal, C. C., & Zhai, C. (Eds.). (2012). Mining text data. Springer Science & Business Media.

Provost, F.; Fawcett, T. Data Science for Business: What you need to know about data mining and data analytics thinking by O'Reilly Media, 2013.

Katti Faceli, Ana Carolina Lorena, João Gama, Thiago Agostinho de Almeida, André C.P.L.F. de Carvalho, Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina, LTC; 2ª edição, 2021.


Zong, C., Xia, R., & Zhang, J. (2021). Text Data Mining (Vol. 711, p. 712). Singapore: Springer.

Aggarwal, C. C. (2018). Machine learning for text. Cham: Springer International Publishing.
M. J. Zaki and W. Meira - Data Mining and Machine Learning: Fundamental Concepts and Algorithms, 2'Ed: Cambridge University Press, 2020.

Artigos recentes dos periódicos Information Sciences Journal, Neural Networks, Neurocomputing, Machine Learning, Applied Intelligence, Journal of Machine Learning Research, Intelligent Data Analysis, Physical Review e outros, bem como de conferências importantes da área.44

Carga Horária:

20 horas
Tipo: Optativa
Vagas oferecidas: 245
 
Ministrantes: Ricardo Marcondes Marcacini


 
 voltar

Créditos
© 1999 - 2024 - Superintendência de Tecnologia da Informação/USP