Universidade Estadual de Feira de Santana - Engenharia de Computação
EXA864 - Mineração de Dados (2018.1)
Prof. Rodrigo Tripodi Calumby
Materiais da Aulas
[20/03] Apresentação da disciplina (slides)
[20/03] Computação, Dados e Inteligência (slides)
[27/03] Introdução: KDD, CRISP-DM e Data Mining (slides)
[03/04] Dados e Análise Descritiva (programa, exercício1)
[10/04] Similaridade e pré-processamento de dados (exercício 2)
[12/04] Técnicas de pré-processamento de dados - Parte 1 (programa)
[17/04] Aula prática (Laboratório MP53) - Dados e Análise Descritiva
[24/04] Técnicas de pré-processamento de dados - Parte 2 (programa)
[26/04] Introdução à classificação de dados e Árvores de Decisão (programa)
[03/05] Otimização de Árvores de Decisão e Descoberta de Regras de Classificação (programa)
[08/05] Avaliação e Seleção de Classificadores - Parte 1: Avaliação Quantitativa (programa, exercício 3)
[10/05] Avaliação e Seleção de Classificadores - Parte 2: Avaliação de Predição Numérica (programa)
[15/05] Avaliação e Seleção de Classificadores - Parte 3: Protocolos Experimentais (programa)
[24/05] Classificadores Probabilísticos + Classificadores baseados em memória/distância (programa); Desafio Prático 1 (dados)
[05/06] Agrupamento de Dados - Parte 1: Introdução (programa)
[07/06] Agrupamento de Dados - Parte 2: Algoritmos (programa)
[12/06] Agrupamento de Dados - Parte 3: Avaliação Intríseca (programa)
[14/06] Agrupamento de Dados - Parte 4: Avaliação Extríseca (programa)
[19/06] Mineração de Padrões Frequentes e Regras de Associação (programa)
[21/06] Regras de Associação (FP-Growth) + Desafio Prático 2 (dados, abreviaturas)
[26/06] Desafio 2
[28/06] Revisão do Desafio 1
[03/07] Ensemble Learning (programa)
[05/07] Consultoria do Projeto 2
[10/07] Mineração de Dados Multimídia
[12/07] Exercícios de Revisão (exercício)
[17/07 e 19/07] Aulas extras: consultoria sobre desafio 2 e conteúdo da prova
[24/07 a 02/08] Seminário
[14/08] Prova Final
PROGRAMA
Parte 1 - Introdução
- Introdução à KDD e Mineração de Dados
- Dados, pré-processamento e análise descritiva e exploratória
- Similaridade/distância de dados
Parte 2 – Algoritmos e Métodos
- Regressão
- Regras de Associação
- Classificação
- Agrupamento
- Avaliação de Eficácia
Parte 3 – Fusão e Características
- Ensemble
- Engenharia de características
Parte 4 - Tópicos Especiais
- Mineração de textos
- Mineração de dados multimídia
- Recuperação da Informação
- Sistemas de Recomendação
- Mineração de opiniões
Parte 5 - Tópicos Avançados
- Active Learning
- Big Data Analytics
- Visual Analytics
HABILIDADES E COMPETÊNCIAS
Ao concluir a disciplina, o estudante deverá possuir as seguintes competências e habilidades:
- Ser capaz de identificar problemas cujas soluções possam ser construídas a partir da análise de dados;
- Realizar processos de preparação de dados para atividades de mineração;
- Conhecer as diferentes atividades de mineração de dados, os algoritmos aplicáveis em cada cenário, suas características de operação e limitações;
- Dominar os diferentes processos experimentais de avaliação de eficácia de métodos de mineração de dados;
- Possuir conhecimento amplo sobre as diversas aplicações da mineração de dados.
OBJETIVO GERAL
Capacitar os alunos a resolverem problemas através da interpretação de cenários, modelando soluções através de técnicas e métodos de Mineração de Dados.
OBJETIVOS ESPECÍFICOS
- Apresentar aos estudantes a grande área de Descoberta de Conhecimento em Bases de Dados;
- Capacitar os estudantes a realizar atividades de preparação de dados para mineração;
- Capacitar os estudantes a aplicar as técnicas de mineração de dados;
- Permitir que os estudantes tenham experiência prática no desenvolvimento de soluções de mineração de dados aplicadas a diferentes problemas da vida real;
- Permitir o desenvolvimento de conhecimento técnico-científico acerca da avaliação de eficácia de sistemas de mineração de dados;
- Apresentar uma visão geral de tópicos avançados relacionados à mineração de dados, processamento analítico/preditivo em larga escala e como estas tecnologias podem trazer contribuições decisivas ao processo de tomada de decisões.
METODOLOGIA
- Aulas expositivas
- Atividades práticas em laboratórios
- Projetos práticos
- Seminários
AVALIAÇÃO
- Avaliação 1: Desafio prático 1 (peso 3) - Resultado e Comentários
- Avaliação 2: Desafio prático 2 (peso 3) - Resultado e Comentários
- Avaliação 3: Seminário (peso 2) - Resultado
- Avaliação 4: Prova escrita (peso 2) - Resultado Geral
CRONOGRAMA DAS ATIVIDADES
[20/03/18 a 24/07/18] Aulas teóricas
[22/05/18] Início do projeto 1
[18/06/18] Entrega do projeto 1
[21/06/18] Início do projeto 2 (prazo do pré-projeto 26/07)
[24/07/18...] Seminários
[28/07/18] Entrega do projeto 2
[07/08/18] Prova
[14/08/18] Prova Final
BIBLIOGRAFIA BÁSICA
- I. H. Witten; E. Frank. Data Mining: practical machine learning tools and techniques 4th Edition. Morgan Kaufmann Publishers, 2017.
- J. Han; M. Kamber; and J. Pei. Data Mining: Concepts and Techniques, 3rd ed. Morgan Kaufmann Publishers, 2011.
- L. de Castro; D. Ferrari. Introdução à Mineração de Dados: Conceitos Básicos, Algoritmos e Aplicações. Saraiva, 2017.
BIBLIOGRAFIA COMPLEMENTAR
- C. C. Aggarwal. Data Mining: The Text Book. Springer. 2015.
- M. J. Zaki; and W. M. Jr. Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press. 2014.
- J. Leskovec; A. Rajaraman; J. D. Ullman. Mining of Massive Datasets. Cambridge University Press, 2014.
- Max Bramer. Principles of Data Mining. Springer. 2016.