Universidade Estadual de Feira de Santana - Engenharia de Computação

 

EXA864 - Mineração de Dados (2018.1) 

Prof. Rodrigo Tripodi Calumby

 

Materiais da Aulas

[20/03] Apresentação da disciplina (slides)

[20/03] Computação, Dados e Inteligência (slides)

[27/03] Introdução: KDD, CRISP-DM e Data Mining (slides)

[03/04] Dados e Análise Descritiva (programaexercício1)

[10/04] Similaridade e pré-processamento de dados (exercício 2)

[12/04] Técnicas de pré-processamento de dados - Parte 1 (programa)

[17/04] Aula prática (Laboratório MP53) - Dados e Análise Descritiva

[24/04] Técnicas de pré-processamento de dados - Parte 2 (programa)

[26/04] Introdução à classificação de dados e Árvores de Decisão (programa)

[03/05] Otimização de Árvores de Decisão e Descoberta de Regras de Classificação (programa)

[08/05] Avaliação e Seleção de Classificadores - Parte 1: Avaliação Quantitativa (programaexercício 3)

[10/05] Avaliação e Seleção de Classificadores - Parte 2: Avaliação de Predição Numérica (programa)

[15/05] Avaliação e Seleção de Classificadores - Parte 3: Protocolos Experimentais (programa)

[24/05] Classificadores Probabilísticos + Classificadores baseados em memória/distância (programa); Desafio Prático 1 (dados)

[05/06] Agrupamento de Dados - Parte 1: Introdução (programa)

[07/06] Agrupamento de Dados - Parte 2: Algoritmos (programa)

[12/06] Agrupamento de Dados - Parte 3: Avaliação Intríseca (programa)

[14/06] Agrupamento de Dados - Parte 4: Avaliação Extríseca (programa)

[19/06] Mineração de Padrões Frequentes e Regras de Associação (programa)

[21/06] Regras de Associação (FP-Growth) + Desafio Prático 2 (dadosabreviaturas)

[26/06] Desafio 2

[28/06] Revisão do Desafio 1

[03/07] Ensemble Learning (programa)

[05/07] Consultoria do Projeto 2

[10/07] Mineração de Dados Multimídia

[12/07] Exercícios de Revisão (exercício)

[17/07 e 19/07] Aulas extras: consultoria sobre desafio 2 e conteúdo da prova

[24/07 a 02/08] Seminário

[14/08] Prova Final 

PROGRAMA 

Parte 1 - Introdução

- Introdução à KDD e Mineração de Dados

- Dados, pré-processamento e análise descritiva e exploratória

- Similaridade/distância de dados

Parte 2 – Algoritmos e Métodos

- Regressão

- Regras de Associação

- Classificação

- Agrupamento

- Avaliação de Eficácia

Parte 3 – Fusão e Características

- Ensemble

- Engenharia de características

Parte 4 - Tópicos Especiais

- Mineração de textos

- Mineração de dados multimídia

- Recuperação da Informação

- Sistemas de Recomendação

- Mineração de opiniões

Parte 5 - Tópicos Avançados

- Active Learning

- Big Data Analytics

- Visual Analytics

 

HABILIDADES E COMPETÊNCIAS 

Ao concluir a disciplina, o estudante deverá possuir as seguintes competências e habilidades:

- Ser capaz de identificar problemas cujas soluções possam ser construídas a partir da análise de dados;

- Realizar processos de preparação de dados para atividades de mineração;

- Conhecer as diferentes atividades de mineração de dados, os algoritmos aplicáveis em cada cenário, suas características de operação e limitações;

- Dominar os diferentes processos experimentais de avaliação de eficácia de métodos de mineração de dados;

- Possuir conhecimento amplo sobre as diversas aplicações da mineração de dados.

 

OBJETIVO GERAL 

Capacitar os alunos a resolverem problemas através da interpretação de cenários, modelando soluções através de técnicas e métodos de Mineração de Dados.

 

OBJETIVOS ESPECÍFICOS 

- Apresentar aos estudantes a grande área de Descoberta de Conhecimento em Bases de Dados;

- Capacitar os estudantes a realizar atividades de preparação de dados para mineração;

- Capacitar os estudantes a aplicar as técnicas de mineração de dados;

- Permitir que os estudantes tenham experiência prática no desenvolvimento de soluções de mineração de dados aplicadas a diferentes problemas da vida real;

- Permitir o desenvolvimento de conhecimento técnico-científico acerca da avaliação de eficácia de sistemas de mineração de dados;

- Apresentar uma visão geral de tópicos avançados relacionados à mineração de dados, processamento analítico/preditivo em larga escala e como estas tecnologias podem trazer contribuições decisivas ao processo de tomada de decisões.

 

METODOLOGIA 

- Aulas expositivas

- Atividades práticas em laboratórios

- Projetos práticos

- Seminários

 

AVALIAÇÃO 

- Avaliação 1: Desafio prático 1 (peso 3) - Resultado e Comentários

- Avaliação 2: Desafio prático 2 (peso 3) - Resultado e Comentários

- Avaliação 3: Seminário (peso 2) - Resultado

- Avaliação 4: Prova escrita (peso 2) - Resultado Geral

 

CRONOGRAMA DAS ATIVIDADES 

[20/03/18 a 24/07/18] Aulas teóricas

[22/05/18] Início do projeto 1

[18/06/18] Entrega do projeto 1

[21/06/18] Início do projeto 2 (prazo do pré-projeto 26/07)

[24/07/18...] Seminários

[28/07/18] Entrega do projeto 2

[07/08/18] Prova 

[14/08/18] Prova Final 

BIBLIOGRAFIA BÁSICA 

- I. H. Witten; E. Frank. Data Mining: practical machine learning tools and techniques 4th Edition. Morgan Kaufmann Publishers, 2017.

- J. Han; M. Kamber; and J. Pei. Data Mining: Concepts and Techniques, 3rd ed. Morgan Kaufmann Publishers, 2011.

- L. de Castro; D. Ferrari. Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplicações. Saraiva, 2017.

 

BIBLIOGRAFIA COMPLEMENTAR

- C. C. Aggarwal. Data Mining: The Text Book. Springer. 2015.

- M. J. Zaki; and W. M. Jr. Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press. 2014.

- J. Leskovec; A. Rajaraman; J. D. Ullman. Mining of Massive Datasets. Cambridge University Press, 2014.

- Max Bramer. Principles of Data Mining. Springer. 2016.