GSI024 - Organização e Recuperação de Informação - 2º Sem. de 2016

Informações

  • Terças-feiras, 19h - Sala de laboratório: Bloco 1B, Laboratório 4
  • Quintas-feiras, 20h50 - Sala de aula teórica: Bloco 1B - Sala 210
  • Sobre a disciplina

  • Plano da disciplina
  • Ementa da disciplina
  • Curso: Sistemas de Informação
  • Livro texto
  • Notas: notas finais

    Conteúdo da prova 2: capítulos 11,13,16, 19 do livro-texto

    Listas de exercícios

  • Lista 3
  • Lista 2
  • Lista 1
  • Material de Aula

    Aulas teóricas

  • 01 - Modelo booleano - slides
  • 02 - Vocabulário de termos - slides
  • 03 - Busca tolerante e dicionário - slides
  • 04 - Construção de índice - slides
  • 05 - Ranking - slides
  • 06 - Sistema completo - slides
  • 07 - Avaliação - slides
  • 08 - Expansão de consultas - slides de aula
  • 09 - Modelo probabilístico - slides
  • 10 - Classificador bayesiano - slides de aula
  • 11 - Agrupamento - slides de aula
  • 12 - A web - slides de aula
  • 13 - Análise de links - slides de aula
  • 14 - Crawling - slides de aula
  • 15 - Aprendizado de Ranking - slides de aula - Redes neurais artificiais
  • 16 - Protótipo do Google e Futuro - slides de aula
  • Aulas práticas

  • corpus.zip - corpus de documentos sobre currículos vitae
  • Descrição da Prática 13 - Apache Lucene

  • Descrição da Prática 12 - Web Crawler
  • Descrição da Prática 11 - Naive Bayes
  • Descrição da Prática 10 - Índice direto
  • Descrição da Prática 9 - Busca tolerante
  • Descrição da Prática 8 - Modelo vetorial
  • Descrição da Prática 7 - Frequência de termos em documentos
  • Descrição da Prática 6 - Apresentação de resultados
  • Descrição da Prática 5 - Busca booleana
  • Descrição da Prática 4 - Construção do Índice Invertido
  • Descrição da Prática 3 - Identificação de ocorrências
  • Descrição da Prática 2 - Construção de vocabulário
  • Descrição da Prática 1 - Introdução
  • Informações adicionais

  • Tudo sobre estruturas de dados... sem complicar
  • 10/06/2015 - Algoritmo para calcular a distância de Levenshtein é provado ser ótimo se P != NP - artigo científico
  • O material de aula é baseado nos slides de um curso de Information Retrieval and Text Mining da Universidade de Stuttgart, disponibilizados pelo autor do livro-texto H. Schütze e por W. Kessler.
  • Explicação do Google sobre como buscas são feitas - link