SHORT COURSES

Short course 1: 02/out/2017, 08:30 às 10:00 e 10:30 às 12:00 - É uma questão de tempo! Extraindo Conhecimento de Redes Sociais Temporais (It’s a matter of time! Knowledge Discovery from Temporal Social Networks)

Resumo: Os dados estão estruturados na forma de rede. E agora? Como analisá-los? Extrair conhecimento desse tipo de dado não é uma tarefa simples e requer o uso de ferramentas e técnicas adequadas, especialmente em cenários que levam em conta o volume de dados e o aspecto temporal da rede. Existe uma vasta literatura acerca de como coletar, pré-processar e modelar dados de mídias sociais em forma de redes, bem como acerca das principais métricas de centralidade. Porém, ainda há muito a ser discutido em relação à análise da rede obtida. Neste minicurso considera-se, então, que os dados já foram coletados e já estão estruturados em forma de rede e discute-se sobre técnicas para analisá-los, considerando especialmente a perspectiva temporal. Primeiro serão apresentados conceitos relacionados à definição do problema, redes temporais e métricas para análise de rede. Em seguida, em um aspecto mais prático serão mostradas técnicas de visualização e processamento de redes socias temporais. o final, três estudos de caso com dados de playlists de músicas, do Twitter e de ligações telefônicas serão discutidos, ilustrando do começo ao fim como funciona a extração de conhecimento de dados em redes sociais temporais.

Abstract: Data is structured as a network. And now? How to analyze it? Extracting knowledge from network data is not a simple task and requires the use of appropriate tools and techniques, especially in scenarios that take into account the volume and evolving aspects of the network. There is a vast literature on how to collect, process and model social media data in the form of networks, as well as key metrics of centrality. However, there is still much to be discussed in relation to the analysis of the underlying network. In this short course we consider that data has already been collected and is already structured as a network. The goal is to discuss techniques to analyze these network data, especially considering the time perspective. First, concepts related to problem definition, temporal networks and metrics for network analysis will be presented. Next, in a more practical aspect will be shown techniques of visualization and processing of temporal networks. In the end, three case studies with real data from music playlists, Twitter and phone calls will be discussed, illustrating how to extract knowledge from temporal social networks.

Fabíola S. F. Pereira: Doutoranda em Ciência da Computação na Universidade Federal de Uberlândia (UFU), com período sanduíche no LIAAD, um grupo pertencente ao INESC TEC, Portugal. Possui graduação (2009) e mestrado (2011) em Ciência da Computação também pela UFU. É autora de artigos peer-reviewed nas áreas de redes temporais, análise de redes sociais e preferências do usuário. Atuou como chair da special session em redes evolutivas (EvoNets) na conferência DSAA’17

João Gama: É professor associado da Faculdade de Economia, Universidade do Porto. É pesquisador e vice-diretor do LIAAD, um grupo pertencente ao INESC TEC. Obteve o título de Ph.D. pela Universidade do Porto em 2000. Tem trabalhado em diversos projetos nacionais e europeus em sistemas de aprendizado incremental e adaptativo, descoberta de conhecimento ubíquo, aprendizado a partir de dados massivos e em fluxo, etc. É autor de diversos livros em Mineração de Dados e de mais de 250 artigos peer-reviewed nas áreas de aprendizado de máquina, mineração de dados e data streams.

Gina M. B. de Oliveira: Bolsista de produtividade do CNPq de 2001 a 2017 (PQ- 2). Possui graduação em Engenharia Elétrica pela Universidade Federal de Uberlândia (1990), mestrado em Engenharia Eletrônica e Computação pelo Instituto Tecnológico de Aeronáutica (1992) e doutorado em Engenharia Eletrônica e Computação pelo Instituto Tecnológico de Aeronáutica (1999). Pós-doutorado de 07/2013 a 07/2014 na Heriot-Watt University (Edinburgh-Scotland) na área de robótica bio-inspirada. Atualmente é professora associada da Universidade Federal de Uberlândia. Tem experiência na área de Ciência da Computação, atuando principalmente nos seguintes temas: algoritmos genéticos, autômatos celulares, computação evolutiva, computação bio-inspirada, robótica bio-inspirada e inteligência artificial.

Short course 2: 02/out/2017, 08:30 às 10:00 e 10:30 às 12:00 - Como funciona o aprendizado profundo (How Deep Learning works)

SlidesMaterial

Resumo: Aprendizado profundo, como uma subárea de aprendizado de máquina, utiliza da estratégia de criar modelos em camadas de representações cujos parâmetros são aprendidos por meio de exemplos conhecidos. A idéia central que embasa esse tipo de técnica não é nova, mas é recente a fama que o cerca, causada por resultados impressionantes em particular com tarefas relacionadas à percepção, essas historicamente vistas como de difícil resolução por computadores. Apesar de parecerem métodos complexos, esses são na verdade compostos de elementos de processamento simples que realizam basicamente transformações lineares em cadeia, mapeando subsequentes espaços vetoriais. A partir de uma formulação algébrica, esse curso apresenta como funciona o aprendizado profundo desde seus componentes básicos até os algoritmos utilizados para o aprendizado. Como casos de estudo são abordados os problemas de classificação e aprendizado de características em cenários supervisionados e não supervisionados utilizando redes convolucionais e auto-encoders. O objetivo é prover entendimento do funcionamento interno desses modelos e o que os diferem de modelos não profundos, suas vantagens e limitações teóricas, bem como instruções práticas para aplicações.

Abstract: Deep learning, as a subfield of machine learning, uses the strategy of creating models by stacking representation layers whose parameters are learned using known data. The central idea of this type of technique is not new, but it is recent the hype surrounding the field, caused by impressive results in particular with perception-related tasks, which were historically seen to be very difficult to be tackled by computers. Although seemingly complex methods, those are composed of simple computing elements that perform basically a chain of linear transformations, mapping subsequent vector spaces. From an algebraic formulation, this short-course presents how deep learning works from its basic components to the algorithms used to achieve learning. As case-studies the problems of classification and feature learning are presented in supervised and non-supervised scenarios using convolutional networks and auto-encoders. The objective is to provide understanding of the inner workings of such models and what makes them different from non-deep models, their theoretical advantages and limitations, as well as practical instructions for applications.

Moacir Ponti é professor no Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC/USP). Visitante no Centre for Vision, Speech and Signal Processing (CVSSP) da Universidade de Surrey em 2016. Possui doutorado (2008) e mestrado (2004) pela Universidade Federal de São Carlos. Desenvolve pesquisa nas áreas de Reconhecimento de Padrões, Processamento de Sinais, Imagens e Video. Seus interesses de pesquisa atuais incluem Detecção de Anomalias em Vídeos, Aprendizado de Características Espaço-Temporais e Busca Visual Multidomínio.

Short course 3: 02/out/2017, 13:30 às 15:00 e 15:30 às 17:00 - Data Analytics in Sports: Changing the game

Resumo: Nas últimas décadas, pesquisadores vêm desenvolvendo diferentes técnicas para entender quais fatores influenciam os resultados esportivos e, consequentemente, qual o papel da preditibilidade e da aleatoriedade nos jogos. Com a atual evolução das técnicas de aquisição, armazenamento e processamento de grande volumes de informações, as análises de dados ganharam ainda mais importância para a descoberta de novos conhecimentos e vêm transformando os comportamentos de todos envolvidos com o esporte. Este capítulo apresenta uma introdução sobre o tema através de: (i) uma discussão sobre a influência da análise de dados nos esportes, (ii) a apresentação de estudos de casos de sucesso, (iii) uma análise dos processos computacionais para descoberta de conhecimento e modelagem de predição, (iv) uma análise comparativa dos mercados de aposta e (v) uma exploração das oportunidades geradas nesse campo de pesquisa.

Abstract: In the last decades, researchers have been developing different techniques to understand which factors influence the sporting results and, consequently, the role of predictability and randomness in the games. With the current evolution of the techniques of acquisition, storage and processing of large volumes of information, data analyzes has gained even more importance for the discovery of new knowledge and has been transforming the behaviors of all involved with the sport. This chapter presents an introduction to this topic through: (i) a discussion of the influence of data analysis in sports, (ii) the presentation of case studies of success, (iii) an analysis of computational processes for knowledge discovery and prediction modeling, (iv) a comparative analysis of the betting markets, and (v) an exploration of the opportunities generated in this field of research.


Igor Barbosa da Costa é professor de computação do Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB), campus Campina Grande. Possui graduação em Ciência da Computação pela Universidade Federal de Campina Grande – UFCG (2006) e mestrado pela Universidade Federal de Pernambuco – UFPE (2010). Atualmente é doutorando de Ciência da Computação na UFCG e tem realizado pesquisas enolvendo mineração e extração de conhecimento em dados de futebol.


Carlos Eduardo Santos Pires holds a Ph.D. in Computer Science from Universidade Federal de Pernambuco (Brazil). Since 2009, he is a professor in Computer Science at the Computing and Systems Department of the Universidade Federal de Campina Grande, where he currently collaborates with research in the area of Information Systems and Databases at the Data Quality Laboratory of the Universidade Federal de Campina Grande. He has experience in computer science, with emphasis on Databases, acting on the following topics: decision support systems, knowledge discovery, data quality, and information integration.


Leandro Marinho Balby is an assistant professor at the Department of Computer Science of the Federal University of Campina Grande (UFCG), Brazil. He holds BSc (2002) and MSc (2005) degrees in computer science and electrical engineering resp. from UFCG, and a Ph.D. (2010) in computer science from the University of Hildesheim, Germany. His research interests encompass Recommender Systems and Machine Learning (ML) in various domains, including theWeb, social media, education, economy and smart cities. As a result of his work, he has published papers in several major academic venues such as KDD, ECML/PKDD, RecSys, Hypertext, ISMIR and ISWC. In particular, he received the best paper award at the 2015 ACM Conference on Recommender Systems. He is a regular program committee member of several premier conferences in IR and ML, including SIGIR, WWW, WSDM, CIKM, ISMIR, RecSys and SDM. In addition, he co-organized the workshops on Social Personalization (co-located with Hypertext), Social Personalization & Search (co-located with SIGIR) and served as PC chair of the 3rd and 4th Symposium on Knowledge Discovery, Mining and Learning (KDMiLe)