Atividade

109674 - Big Data e Governança de Dados

Período da turma: 24/09/2024 a 12/11/2024

Selecione um horário para exibir no calendário:
 
 
Descrição: Objetivos:

• Compreender o conceito de Big Data.
• Identificar as técnicas e tecnologias existentes em cada fase de um projeto de Big Data (Captura, armazenamento, processamento, análise e visualização de dados).
• Identificar casos de uso de soluções de Big Data aplicado à sustentabilidade.
• Identificar os processos e práticas existentes na governança de dados no contexto de Big Data.
• Executar exemplos práticos da adoção de tecnologias de Big Data no processo de análise de dados

Conteúdo Programático:

1. Introdução a Big Data
1.1. Definição de Big Data.
1.2. Oportunidades e desafios existentes.
1.3. O perfil do profissional cientista de dados.
1.4. Big Data e sustentabilidade.
1.5. As fases de um projeto de Big Data.
2. Governança de Dados na Era de Big Data
2.1. O papel do Chief Data Officer – CDO.
2.2. Processos chaves da Governança de Dados
2.3. Frameworks de Governança de Dados
2.4. Silos de Dados versus Data Lake
3. Projeto de Big Data - Fase de captura e armazenamento de dados
3.1. Dados internos e dados externos
3.2. APIs para captura de dados
3.3. Tecnologia NoSQL versus banco de dados relacional
4. Projeto de Big Data - Fase de processamento dos dados
4.1. Descobrindo o Hadoop
4.2. Armazenamento de dados no Hadoop
4.3. O modelo de programação MapReduce
4.4. Aplicabilidade do Hadoop
4.5. Casos de uso
5. Projeto de Big Data - Fase de análise de dados
5.1. As 4 categorias de analytics
5.2. Técnicas de mineração de dados
5.3. Técnicas de aprendizado de máquina
5.4. Uso da linguagem R
6. Projeto de Big Data - Fase de visualização de dados
6.1. Obtendo desempenho com a visualização de dados
6.2. Técnicas de visualização de dados
6.3. Casos de uso inspiradores

Referências Bibliográficas:

1. MARQUESONE, R. Big Data - Técnicas e Tecnologias para Extração de Valor dos Dados. Casa do Código, São Paulo, 2016.
2. GOLDMAN, Alfredo et al. Apache Hadoop: conceitos teóricos e práticos, evolução e novas possibilidades. XXXI Jornadas de atualizaçoes em informatica, p. 88-136, 2012.
3. PROVOST, Foster; FAWCETT, Tom. Data Science for Business: What you need to know about data mining and data-analytic thinking. " O'Reilly Media, Inc.", 2013.
4. MCCREARY, Dan; KELLY, Ann. Making sense of NoSQL. Shelter Island: Manning, p. 19-20, 2014.
5. WHITE, Tom. Hadoop: The definitive guide. " O'Reilly Media, Inc.", 4ed, 2015.
6. MANYIKA, James et al. Big data: The next frontier for innovation, competition, and productivity. 2011.
7. SOARES, Sunil. The chief data officer handbook for data governance. Mc Press, 2015.
8. TALLON, Paul P. Corporate governance of big data: Perspectives on value, risk, and cost. Computer, v. 46, n. 6, p. 32-38, 2013.

Carga Horária:

18 horas
Tipo: Obrigatória
Vagas oferecidas: 55
 
Ministrantes: Pedro Luiz Pizzigatti Corrêa


 
 voltar

Créditos
© 1999 - 2025 - Superintendência de Tecnologia da Informação/USP