If you have difficulties viewing the program, please clique here!

Conference maps: clique here!

*** Presenters have 15 minutes for presentation and 5 minutes for questions.

Program Schedule
More Info
October 2nd, 2017 (Monday)
08:00 AM - 08:30 Registration desk
08:30 - 10:00 Short course 1: É uma questão de tempo! Extraindo Conhecimento de Redes Sociais Temporais /It’s a matter of time! Knowledge Discovery from Temporal Social Networks (Sara Kubitschek 4)

Data is structured as a network. And now? How to analyze it? Extracting knowledge from network data is not a simple task and requires the use of appropriate tools and techniques, especially in scenarios that take into account the volume and evolving aspects of the network. There is a vast literature on how to collect, process and model social media data in the form of networks, as well as key metrics of centrality. However, there is still much to be discussed in relation to the analysis of the underlying network. In this short course we consider that data has already been collected and is already structured as a network. The goal is to discuss techniques to analyze these network data, especially considering the time perspective. First, concepts related to problem definition, temporal networks and metrics for network analysis will be presented. Next, in a more practical aspect will be shown techniques of visualization and processing of temporal networks. In the end, three case studies with real data from music playlists, Twitter and phone calls will be discussed, illustrating how to extract knowledge from temporal social networks.

08:30 - 10:00 Short course 2: Como funciona o Deep Learning /How Deep Learning works (Sara Kubitschek 2)

Deep learning, as a subfield of machine learning, uses the strategy of creating models by stacking representation layers whose parameters are learned using known data. The central idea of this type of technique is not new, but it is recent the hype surrounding the field, caused by impressive results in particular with perception-related tasks, which were historically seen to be very difficult to be tackled by computers. Although seemingly complex methods, those are composed of simple computing elements that perform basically a chain of linear transformations, mapping subsequent vector spaces. From an algebraic formulation, this short-course presents how deep learning works from its basic components to the algorithms used to achieve learning. As case-studies the problems of classification and feature learning are presented in supervised and non-supervised scenarios using convolutional networks and auto-encoders. The objective is to provide understanding of the inner workings of such models and what makes them different from non-deep models, their theoretical advantages and limitations, as well as practical instructions for applications.

10:00 - 10:30 coffee break
10:30 - 12:00 Short course 1: É uma questão de tempo! Extraindo Conhecimento de Redes Sociais Temporais / It’s a matter of time! Knowledge Discovery from Temporal Social Networks (Sara Kubitschek 4)
10:30 - 12:00 Short course 2: Como funciona o Deep Learning / How Deep Learning works (Sara Kubitschek 2)
12:00 - 13:30 Lunch Break
13:30 - 15:00 KDMiLe Technical Session I: Classification (Sara Kubitschek 2)

13:30 Improving Activity Recognition using Temporal Regions. João Paulo Aires (PUC-RS), Juarez Monteiro (PUC-RS), Roger Granada (PUC-RS), Felipe Meneguzzi (PUC-RS) and Rodrigo Barros (PUC-RS).
13:50 Label Powerset for Multi-label Data Streams Classification with Concept Drift. Joel Costa (UFSCar), Elaine Ribeiro de Faria Paiva (UFU), Jonathan Andrade Silva (UFMS) and Ricardo Cerri (UFSCar).
14:10 Using Scene Context to Improve Object Recognition. Leandro Pereira Da Silva (PUC-RS), Roger Granada (PUC-RS), Juarez Monteiro (PUC-RS) and Duncan Dubugras Alcoba Ruiz (PUC-RS).
14:30 Um Método de Aprendizado Multirrótulo baseado em Aprendizado Não-Supervisionado Hierárquico. Rodrigo Rodovalho (UFF) and Flavia Bernardini (UFF).

15:00 - 15:30 coffee break
15:30 - 17:00 KDMiLe Meet-up – Women in Data Science (Sara Kubitschek 2)
Data science is an interdisciplinary field about processes and systems to extract knowledge or insights from data in various forms, either structured or unstructured, which is a continuation of some of the data analysis fields such as statistics, machine learning, data mining, and predictive analytics. Data science encompasses several areas such as data analytics, machine learning, statistics, optimization and managing big data. The Meet-up will bring together women researchers and practitioners in the field to deal with the emerging challenges in processing both from theoretical and practical works on data science and advanced analytics.
17:30 - 19:20 SBBD/KDMiLe/BRACIS Industrial Panel (Center Convention A1)
19:30 - 22:00 Women in Databases (jantar por adesão para a comunidade feminina de BD): inscrições em ! Mensagens do grupo em
October 3rd, 2017 (Tuesday)
08:00 AM - 08:30 Registration desk
08:30 - 10:00 KDMiLe Technical Session II: Text Mining (B4)

08:30 Chatbot baseado em Deep Learning: um Estudo para Lingua Portuguesa. Andherson Maeda (PUC-RS) and Silvia Moraes (PUC-RS).
08:50 A Review of Text-Based and Knowledge-Based Semantic Similarity Measures. Angelica Ribeiro (USP), Zhao Liang (USP) and Alessandra Macedo (USP).
09:10 Estratégias de Correção de Erros de Extratores de Palavras em Português. Matheus Nogueira (UFES) and Elias Oliveira (UFES).
09:30 TATModel - Em Direção a um Novo Modelo para Avaliação de Traduções Automáticas de Texto. Rafael Guimarães Rodrigues (CEFET-RJ) and Gustavo Paiva Guedes (CEFET-RJ).

10:00 - 10:30 coffee break
10:30 - 12:00 Keynote speaker: A Holistic View of Human Factors in Crowdsourcing, Sihem Amer-Yahia (B2/B3)

For over 40 years, organization studies have examined human factors in physical workplaces and their influence on the ability of an individual to perform a task, or a set of tasks, alone or in collaboration with others. In a virtual marketplace, the crowd is typically volatile, its arrival and departure asynchronous, and its levels of attention and accuracy diverse. This has generated a wealth of new research ranging from studying workers’ fatigue in task completion to examining the role of motivation in task assignment. I will review such work and argue that we need a holistic view to take full advantage of human factors such as skills, expected wage and motivation, in improving the performance of a crowdsourcing platform.

12:00 - 14:00 Lunch Break
14:00 - 15:30 KDMiLe Technical Session III: Bioinformatics (B4)

14:00 Classificação Hierárquica e Não Hierárquica de Elementos Transponíveis.Gean Pereira (UFSCar) and Ricardo Cerri (UFSCar).
14:20 A novel probabilistic Jaccard distance measure for classification of sparse and uncertain data.Igor Martire (UFF), Pablo Nascimento Da Silva (UFF), Alexandre Plastino (UFF), Fabio Fabris (University of Kent) and Alex Freitas (University of Kent).
14:40 An Empirical Comparison of Hierarchical and Ranking-Based Feature Selection Techniques in Bioinformatics Datasets.Luan Rios Campos (UEFS) and Matheus Giovanni Pires (UEFS).
15:00 SVM Cascata para o Problema de Predição de Sítio de Início de Tradução. Wallison Guimaraes (PUC-MG), Cristiano Pinto (EMGE), Cristiane Nobre (PUC-MG) and Luis Zárate (PUC-MG).

15:30 - 16:00 coffee break / Recepção dos calouros do SBBD: Café com o Homenageado
16:00 - 17:30 KDMiLe Invited Talk: Sentiment Analysis in Social media: Challenges and Solutions, Marcos Gonçalves (B4)

Sentiment analysis is an ongoing field of research in text mining that deals mainly with the task of identifying the polarity (positive, negative or neutral) expressed in a piece of text. Given the recent popularity of Online Social Networks (OSNs) and other Web 2.0 applications (e.g., micro-blogs), sentiment analysis has become an important research topic, mainly when considering short and informal texts, a challenging scenario. Applications of sentiment analysis include the monitoring of reviews or opinions about a company, product or a brand; political analyses, such as the tracking of sentiments expressed by voters about candidates; among many others. In this talk, I’ll give a brief introduction to the field, present the main approaches proposed so far to deal with it, and explain their limitations and the challenges ahead, which include, for instance: ambiguity, noise, and sarcasm; lack of benchmarks; instability of the proposed methods across domains; low coverage of the methods; incompleteness of existing lexicons; etc. I’ll also present some of our solutions developed to tackle several of these issues, based mainly on novel machine learning and information retrieval techniques.

18:00 - 19:00 KDMiLe Technical Session IV: Clustering (B4)

18:00 Um Método para Predição de Ligações em Redes Complexas Baseado em Históricos da Topologia de Grafos. Érick Florentino (IME) and Ronaldo Ribeiro Goldschmidt (IME).
18:20 SOUTH-N: um método para a detecção semi-supervisionada de outliers em dados de alta dimensão. Lucimeire Alves Da Silva (UFU), Maria Camila Nardini Barioni (UFU) and Humberto Luiz Razente (UFU).
18:40 Evaluation of clustering methods on co-occurrence matrices. Diorge Brognara (UFSCar), Thiago Zafalon Miranda (UFSCar) and Estevam Rafael Hruschka Jr (UFSCar).

18:00 - 19:00 KDD-BR Competition (B1)
19:30 - 20:30 Official Opening Ceremony (A2/A3)
20:30 - 21:30 Welcome Cocktail
October 4th, 2017 (Wednesday)
08:00 AM - 08:30 Registration desk
08:30 - 10:00 KDMiLe Technical Session V: Applications 1 (B4)

08:30 Um método para identificação de pessoas em cenários de risco em ambientes de segurança crítica – uma análise experimental em ambientes offshore. Felipe Oliveira (UFF), Flavia Bernardini (UFF) and Marcilene Viana (UFF).
08:50 A Machine Learning Predictive System to Identify Students in Risk of Dropping Out of College. Gabriel Silva (UnB) and Marcelo Ladeira (UnB).
09:10 Identificação de Candidatos a Fiscalização por Evasão do Tributo ISS. Marcelo Dias (UFRGS) and Karin Becker (UFRGS).
09:30 AILINE-Um Método Inteligente para Detecção Automática de Linhas Espectrais em Galáxias. Yvson P. N. Ferreira (PGCA/UEFS), Iranderly F. de Fernandes (PGCA/UEFS) and Angelo C. Loula (PGCA/UEFS).

10:00 - 10:30 coffee break
10:30 - 12:00 Keynote speaker: Pesquisador Homenageado do SBBD 2017, José Palazzo Moreira de Oliveira (B2/B3)

Como professor e pesquisador, desde minha formatura na Escola de Engenharia da UFRGS, tive a rara sorte de acompanhar o desenvolvimento da Computação e do ensino de Banco de Dados nas universidades brasileiras. Minha ontogênese acadêmica acompanhou o percurso da história do SBBD. Esta distinção foi uma grande alegria e surpresa, em uma época em que a avaliação de um pesquisador é constituída quase exclusivamente por índices bibliométricos, em receber um reconhecimento pelo conjunto da obra. Algo muito relevante para mim foi que os jovens colegas se lembraram de uma carreira de 48 anos, quando a maioria de vocês ainda não tinha nascido, com forte dedicação à área de Sistemas de Informação e Banco de Dados. Ao logo da carreira desenvolvi atividades em múltiplas dimensões, 81 alunos de pós-graduação já orientados, muitas disciplinas ministradas, e um consistente número de boas publicações. Tinha que decidir o formato desta apresentação, uma alternativa seria descrever tecnicamente minhas pesquisas representadas pelas publicações, isto não seria uma boa contribuição para a comunidade, então resolvi apresentar as áreas de pesquisa em que tenho trabalhado e sua evolução ao logo destes anos, sem entrar em profundos detalhes técnicos. Este andamento seguiu muito de perto a evolução do SBBD. Desejo que a apresentação seja útil para os jovens pesquisadores conhecerem melhor o caminho e vislumbrarem o futuro. Uma das atividades que considero importante foi a implementação do 1° Concurso de Teses e Dissertações em Banco de Dados. A vida acadêmica não pode ser uma Torre de Marfim, a preocupação e engajamento com a comunidade é essencial. Nesta apresentação vocês terão a oportunidade de conhecer, de forma agradável, o desenvolvimento de nossa área no Brasil em paralelo com uma análise do que considero essencial para uma carreira equilibrada no ensino e na pesquisa. A história dos Bancos de Dados inicia com a estruturação de arquivos tradicionais e chega aos complexos sistemas atuais. As noções de transação, recuperação e outras são essenciais para a maioria das aplicações transacionais. Hoje há uma revolta contra tudo isto propondo novas alternativas como o NoSQL, mas diferentes aplicações exigem diversos modelos de SGBDs. O que nos aguarda para o futuro? Como vamos estruturar nossas carreiras em um período turbulento?

12:00 - 14:00 Lunch Break
14:00 - 15:30 KDMiLe Technical Session VI: Applications 2 (B4)

14:00 Acoplamento para resolução de correferência em ambiente de aprendizado sem-fim. Felipe Quecole (UFSCar), Maisa Cristina Duarte (Université Jean Monnet) and Estevam Rafael Hruschka Jr (UFSCar).
14:20 Using graph-based centrality measures for sentiment analysis. George Vilarinho (USP), Mateus Machado (USP) and Evandro Ruiz (USP).
14:40 A Deep Learning Approach to Prioritize Customer Service Using Social Networks. Paulo Amora (UFC), Elvis Teixeira (UFC), Maria Lima (UFC), Gabriel Amaral (UFC), José Cardozo (Digitro Tecnologia SA) and Javam Machado (UFC).
15:00 Extração automática de sementes para sistemas de aprendizado sem-fim. Romão Matheus Martines de Jesus (UFSCar), Maisa Cristina Duarte (Université Jean Monnet) and Estevam Rafael Hruschka Jr (UFSCar).

15:30 - 16:00 coffee break
16:00 - 17:30 KDMiLe Technical Session VII: Machine Learning Theory (B4)

16:00 Parameter Learning in ProbLog with Probabilistic Rules. Arthur Colombini Gusmão (USP), Francisco Henrique Otte Vieira de Faria (USP), Glauber De Bona (USP), Fabio Gagliardi Cozman (USP) and Denis Deratani Mauá (USP).
16:20 A Dispersion-Based Discretization Method for Models Explanation. Bernardo Stearns (UFRJ), Fabio Rangel (UFRJ), Fabrício Faria (UFRJ) and Jonice Oliveira (UFRJ).
16:40 Learning Probabilistic Relational Models: A Simplified Framework, a Case Study, and a Package. Luiz Henrique Mormille (USP) and Fabio Gagliardi Cozman (USP).

19:30 - 22:30 Conference Dinner (Praia Clube)