SHORT COURSES

Short course 1: 02/out/2017, 08:30 às 10:00 e 10:30 às 12:00 - É uma questão de tempo! Extraindo Conhecimento de Redes Sociais Temporais (It’s a matter of time! Knowledge Discovery from Temporal Social Networks)

Resumo: Os dados estão estruturados na forma de rede. E agora? Como analisá-los? Extrair conhecimento desse tipo de dado não é uma tarefa simples e requer o uso de ferramentas e técnicas adequadas, especialmente em cenários que levam em conta o volume de dados e o aspecto temporal da rede. Existe uma vasta literatura acerca de como coletar, pré-processar e modelar dados de mídias sociais em forma de redes, bem como acerca das principais métricas de centralidade. Porém, ainda há muito a ser discutido em relação à análise da rede obtida. Neste minicurso considera-se, então, que os dados já foram coletados e já estão estruturados em forma de rede e discute-se sobre técnicas para analisá-los, considerando especialmente a perspectiva temporal. Primeiro serão apresentados conceitos relacionados à definição do problema, redes temporais e métricas para análise de rede. Em seguida, em um aspecto mais prático serão mostradas técnicas de visualização e processamento de redes socias temporais. o final, três estudos de caso com dados de playlists de músicas, do Twitter e de ligações telefônicas serão discutidos, ilustrando do começo ao fim como funciona a extração de conhecimento de dados em redes sociais temporais.

Abstract: Data is structured as a network. And now? How to analyze it? Extracting knowledge from network data is not a simple task and requires the use of appropriate tools and techniques, especially in scenarios that take into account the volume and evolving aspects of the network. There is a vast literature on how to collect, process and model social media data in the form of networks, as well as key metrics of centrality. However, there is still much to be discussed in relation to the analysis of the underlying network. In this short course we consider that data has already been collected and is already structured as a network. The goal is to discuss techniques to analyze these network data, especially considering the time perspective. First, concepts related to problem definition, temporal networks and metrics for network analysis will be presented. Next, in a more practical aspect will be shown techniques of visualization and processing of temporal networks. In the end, three case studies with real data from music playlists, Twitter and phone calls will be discussed, illustrating how to extract knowledge from temporal social networks.

Fabíola S. F. Pereira: Doutoranda em Ciência da Computação na Universidade Federal de Uberlândia (UFU), com período sanduíche no LIAAD, um grupo pertencente ao INESC TEC, Portugal. Possui graduação (2009) e mestrado (2011) em Ciência da Computação também pela UFU. É autora de artigos peer-reviewed nas áreas de redes temporais, análise de redes sociais e preferências do usuário. Atuou como chair da special session em redes evolutivas (EvoNets) na conferência DSAA’17

João Gama: É professor associado da Faculdade de Economia, Universidade do Porto. É pesquisador e vice-diretor do LIAAD, um grupo pertencente ao INESC TEC. Obteve o título de Ph.D. pela Universidade do Porto em 2000. Tem trabalhado em diversos projetos nacionais e europeus em sistemas de aprendizado incremental e adaptativo, descoberta de conhecimento ubíquo, aprendizado a partir de dados massivos e em fluxo, etc. É autor de diversos livros em Mineração de Dados e de mais de 250 artigos peer-reviewed nas áreas de aprendizado de máquina, mineração de dados e data streams.

Gina M. B. de Oliveira: Bolsista de produtividade do CNPq de 2001 a 2017 (PQ- 2). Possui graduação em Engenharia Elétrica pela Universidade Federal de Uberlândia (1990), mestrado em Engenharia Eletrônica e Computação pelo Instituto Tecnológico de Aeronáutica (1992) e doutorado em Engenharia Eletrônica e Computação pelo Instituto Tecnológico de Aeronáutica (1999). Pós-doutorado de 07/2013 a 07/2014 na Heriot-Watt University (Edinburgh-Scotland) na área de robótica bio-inspirada. Atualmente é professora associada da Universidade Federal de Uberlândia. Tem experiência na área de Ciência da Computação, atuando principalmente nos seguintes temas: algoritmos genéticos, autômatos celulares, computação evolutiva, computação bio-inspirada, robótica bio-inspirada e inteligência artificial.

**Short course 2: 02/out/2017, 08:30 às 10:00 e 10:30 às 12:00 - Como funciona o aprendizado profundo (How Deep Learning works)**

Slides — Material

Resumo: Aprendizado profundo, como uma subárea de aprendizado de máquina, utiliza da estratégia de criar modelos em camadas de representações cujos parâmetros são aprendidos por meio de exemplos conhecidos. A idéia central que embasa esse tipo de técnica não é nova, mas é recente a fama que o cerca, causada por resultados impressionantes em particular com tarefas relacionadas à percepção, essas historicamente vistas como de difícil resolução por computadores. Apesar de parecerem métodos complexos, esses são na verdade compostos de elementos de processamento simples que realizam basicamente transformações lineares em cadeia, mapeando subsequentes espaços vetoriais. A partir de uma formulação algébrica, esse curso apresenta como funciona o aprendizado profundo desde seus componentes básicos até os algoritmos utilizados para o aprendizado. Como casos de estudo são abordados os problemas de classificação e aprendizado de características em cenários supervisionados e não supervisionados utilizando redes convolucionais e auto-encoders. O objetivo é prover entendimento do funcionamento interno desses modelos e o que os diferem de modelos não profundos, suas vantagens e limitações teóricas, bem como instruções práticas para aplicações.

Abstract: Deep learning, as a subfield of machine learning, uses the strategy of creating models by stacking representation layers whose parameters are learned using known data. The central idea of this type of technique is not new, but it is recent the hype surrounding the field, caused by impressive results in particular with perception-related tasks, which were historically seen to be very difficult to be tackled by computers. Although seemingly complex methods, those are composed of simple computing elements that perform basically a chain of linear transformations, mapping subsequent vector spaces. From an algebraic formulation, this short-course presents how deep learning works from its basic components to the algorithms used to achieve learning. As case-studies the problems of classification and feature learning are presented in supervised and non-supervised scenarios using convolutional networks and auto-encoders. The objective is to provide understanding of the inner workings of such models and what makes them different from non-deep models, their theoretical advantages and limitations, as well as practical instructions for applications.

Moacir Ponti é professor no Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC/USP). Visitante no Centre for Vision, Speech and Signal Processing (CVSSP) da Universidade de Surrey em 2016. Possui doutorado (2008) e mestrado (2004) pela Universidade Federal de São Carlos. Desenvolve pesquisa nas áreas de Reconhecimento de Padrões, Processamento de Sinais, Imagens e Video. Seus interesses de pesquisa atuais incluem Detecção de Anomalias em Vídeos, Aprendizado de Características Espaço-Temporais e Busca Visual Multidomínio.

Short course 3: 02/out/2017, 13:30 às 15:00 e 15:30 às 17:00 - Data Analytics in Sports: Changing the game

Resumo: Nas últimas décadas, pesquisadores vêm desenvolvendo diferentes técnicas para entender quais fatores influenciam os resultados esportivos e, consequentemente, qual o papel da preditibilidade e da aleatoriedade nos jogos. Com a atual evolução das técnicas de aquisição, armazenamento e processamento de grande volumes de informações, as análises de dados ganharam ainda mais importância para a descoberta de novos conhecimentos e vêm transformando os comportamentos de todos envolvidos com o esporte. Este capítulo apresenta uma introdução sobre o tema através de: (i) uma discussão sobre a influência da análise de dados nos esportes, (ii) a apresentação de estudos de casos de sucesso, (iii) uma análise dos processos computacionais para descoberta de conhecimento e modelagem de predição, (iv) uma análise comparativa dos mercados de aposta e (v) uma exploração das oportunidades geradas nesse campo de pesquisa.

Abstract: In the last decades, researchers have been developing different techniques to understand which factors influence the sporting results and, consequently, the role of predictability and randomness in the games. With the current evolution of the techniques of acquisition, storage and processing of large volumes of information, data analyzes has gained even more importance for the discovery of new knowledge and has been transforming the behaviors of all involved with the sport. This chapter presents an introduction to this topic through: (i) a discussion of the influence of data analysis in sports, (ii) the presentation of case studies of success, (iii) an analysis of computational processes for knowledge discovery and prediction modeling, (iv) a comparative analysis of the betting markets, and (v) an exploration of the opportunities generated in this field of research.

Igor Barbosa da Costa é professor de computação do Instituto Federal de Educação, Ciência e Tecnologia da Paraíba (IFPB), campus Campina Grande. Possui graduação em Ciência da Computação pela Universidade Federal de Campina Grande – UFCG (2006) e mestrado pela Universidade Federal de Pernambuco – UFPE (2010). Atualmente é doutorando de Ciência da Computação na UFCG e tem realizado pesquisas enolvendo mineração e extração de conhecimento em dados de futebol.

Carlos Eduardo Santos Pires holds a Ph.D. in Computer Science from Universidade Federal de Pernambuco (Brazil). Since 2009, he is a professor in Computer Science at the Computing and Systems Department of the Universidade Federal de Campina Grande, where he currently collaborates with research in the area of Information Systems and Databases at the Data Quality Laboratory of the Universidade Federal de Campina Grande. He has experience in computer science, with emphasis on Databases, acting on the following topics: decision support systems, knowledge discovery, data quality, and information integration.

Leandro Marinho Balby is an assistant professor at the Department of Computer Science of the Federal University of Campina Grande (UFCG), Brazil. He holds BSc (2002) and MSc (2005) degrees in computer science and electrical engineering resp. from UFCG, and a Ph.D. (2010) in computer science from the University of Hildesheim, Germany. His research interests encompass Recommender Systems and Machine Learning (ML) in various domains, including theWeb, social media, education, economy and smart cities. As a result of his work, he has published papers in several major academic venues such as KDD, ECML/PKDD, RecSys, Hypertext, ISMIR and ISWC. In particular, he received the best paper award at the 2015 ACM Conference on Recommender Systems. He is a regular program committee member of several premier conferences in IR and ML, including SIGIR, WWW, WSDM, CIKM, ISMIR, RecSys and SDM. In addition, he co-organized the workshops on Social Personalization (co-located with Hypertext), Social Personalization & Search (co-located with SIGIR) and served as PC chair of the 3rd and 4th Symposium on Knowledge Discovery, Mining and Learning (KDMiLe)