Resumo: Os dados estão estruturados na forma de rede. E agora? Como analisá-los? Extrair conhecimento desse tipo de dado não é uma tarefa simples e requer o uso de ferramentas e técnicas adequadas, especialmente em cenários que levam em conta o volume de dados e o aspecto temporal da rede. Existe uma vasta literatura acerca de como coletar, pré-processar e modelar dados de mídias sociais em forma de redes, bem como acerca das principais métricas de centralidade. Porém, ainda há muito a ser discutido em relação à análise da rede obtida. Neste minicurso considera-se, então, que os dados já foram coletados e já estão estruturados em forma de rede e discute-se sobre técnicas para analisá-los, considerando especialmente a perspectiva temporal. Primeiro serão apresentados conceitos relacionados à definição do problema, redes temporais e métricas para análise de rede. Em seguida, em um aspecto mais prático serão mostradas técnicas de visualização e processamento de redes socias temporais. o final, três estudos de caso com dados de playlists de músicas, do Twitter e de ligações telefônicas serão discutidos, ilustrando do começo ao fim como funciona a extração de conhecimento de dados em redes sociais temporais.
Abstract: Data is structured as a network. And now? How to analyze it? Extracting knowledge from network data is not a simple task and requires the use of appropriate tools and techniques, especially in scenarios that take into account the volume and evolving aspects of the network. There is a vast literature on how to collect, process and model social media data in the form of networks, as well as key metrics of centrality. However, there is still much to be discussed in relation to the analysis of the underlying network. In this short course we consider that data has already been collected and is already structured as a network. The goal is to discuss techniques to analyze these network data, especially considering the time perspective. First, concepts related to problem definition, temporal networks and metrics for network analysis will be presented. Next, in a more practical aspect will be shown techniques of visualization and processing of temporal networks. In the end, three case studies with real data from music playlists, Twitter and phone calls will be discussed, illustrating how to extract knowledge from temporal social networks.
Resumo: Aprendizado profundo, como uma subárea de aprendizado de máquina, utiliza da estratégia de criar modelos em camadas de representações cujos parâmetros são aprendidos por meio de exemplos conhecidos. A idéia central que embasa esse tipo de técnica não é nova, mas é recente a fama que o cerca, causada por resultados impressionantes em particular com tarefas relacionadas à percepção, essas historicamente vistas como de difícil resolução por computadores. Apesar de parecerem métodos complexos, esses são na verdade compostos de elementos de processamento simples que realizam basicamente transformações lineares em cadeia, mapeando subsequentes espaços vetoriais. A partir de uma formulação algébrica, esse curso apresenta como funciona o aprendizado profundo desde seus componentes básicos até os algoritmos utilizados para o aprendizado. Como casos de estudo são abordados os problemas de classificação e aprendizado de características em cenários supervisionados e não supervisionados utilizando redes convolucionais e auto-encoders. O objetivo é prover entendimento do funcionamento interno desses modelos e o que os diferem de modelos não profundos, suas vantagens e limitações teóricas, bem como instruções práticas para aplicações.
Abstract: Deep learning, as a subfield of machine learning, uses the strategy of creating models by stacking representation layers whose parameters are learned using known data. The central idea of this type of technique is not new, but it is recent the hype surrounding the field, caused by impressive results in particular with perception-related tasks, which were historically seen to be very difficult to be tackled by computers. Although seemingly complex methods, those are composed of simple computing elements that perform basically a chain of linear transformations, mapping subsequent vector spaces. From an algebraic formulation, this short-course presents how deep learning works from its basic components to the algorithms used to achieve learning. As case-studies the problems of classification and feature learning are presented in supervised and non-supervised scenarios using convolutional networks and auto-encoders. The objective is to provide understanding of the inner workings of such models and what makes them different from non-deep models, their theoretical advantages and limitations, as well as practical instructions for applications.
Resumo: Nas últimas décadas, pesquisadores vêm desenvolvendo diferentes técnicas para entender quais fatores influenciam os resultados esportivos e, consequentemente, qual o papel da preditibilidade e da aleatoriedade nos jogos. Com a atual evolução das técnicas de aquisição, armazenamento e processamento de grande volumes de informações, as análises de dados ganharam ainda mais importância para a descoberta de novos conhecimentos e vêm transformando os comportamentos de todos envolvidos com o esporte. Este capítulo apresenta uma introdução sobre o tema através de: (i) uma discussão sobre a influência da análise de dados nos esportes, (ii) a apresentação de estudos de casos de sucesso, (iii) uma análise dos processos computacionais para descoberta de conhecimento e modelagem de predição, (iv) uma análise comparativa dos mercados de aposta e (v) uma exploração das oportunidades geradas nesse campo de pesquisa.
Abstract: In the last decades, researchers have been developing different techniques to understand which factors influence the sporting results and, consequently, the role of predictability and randomness in the games. With the current evolution of the techniques of acquisition, storage and processing of large volumes of information, data analyzes has gained even more importance for the discovery of new knowledge and has been transforming the behaviors of all involved with the sport. This chapter presents an introduction to this topic through: (i) a discussion of the influence of data analysis in sports, (ii) the presentation of case studies of success, (iii) an analysis of computational processes for knowledge discovery and prediction modeling, (iv) a comparative analysis of the betting markets, and (v) an exploration of the opportunities generated in this field of research.