Grafos everywhere: como criar e analisar grafos

Atividade exclusiva para pessoas inscritas no Coda.Br 2021.

Inscreva-se já OU faça login

SOBRE O WORKSHOP

Neste workshop, o cientista de dados Janderson Pereira mostra como fazer análise de redes sociais a partir da criação e uso de grafos. Um grafo representa um conjunto de objetos e as relações entre eles. Esses objetos, chamados de nós ou vértices, são elementos individualizados que podem representar uma pessoa, uma empresa, um produto ou qualquer outra entidade. Já as conexões que mantêm entre si, por outro lado, são chamadas de laços ou arestas. Para quantificar essas relações, há o conceito de grau, uma métrica dos nós baseada no número de laços que possui.

A criação de grafos pode ser útil em diversas áreas: análise de tráfego; sociometria; análise de difusão de inovações, notícias e rumores; análise de redes biológicas; epidemiologia e farmacologia; segurança pública; mecanismos de busca e muito mais. Durante a atividade, Pereira comentou exemplos do uso de grafos para análise de temas de cunho científico, político, social e de entretenimento, utilizando inclusive dados coletados de redes sociais online como o Youtube e o Twitter.

Para a obtenção de dados do Youtube, o cientista recomendou a ferramenta Youtube Data Tools. Com ela é possível coletar dados de um canal específico (Channel Info), de uma rede de canais (Channel Network), de uma rede de vídeos (Video Network), informações e estatísticas de uma lista de vídeos (Video List), além de informações e comentários de um vídeo específico (Video Info and Comments). Já para a coleta de dados do Twitter, Pereira disponibilizou um script na linguagem de programação R – lembrando que, para executá-lo, é necessário requisitar acesso à API no Twitter.

O workshop contou com uma parte prática onde foram analisados dados do Youtube a partir da elaboração de um grafo utilizando o Gephi, um software, gratuito e de código aberto, voltado à visualização e exploração de grafos e redes. Nesse programa, os usuários podem interagir com a representação dos grafos, manipular as estruturas, formas e cores para revelar padrões ocultos no conjunto de dados utilizado.

A partir do conjunto de dados obtido, o cientista de dados personalizou o grafo em um passo a passo para que a análise fosse possível. O Gephi oferece uma série de métricas a serem calculadas de forma automatizada, como o grau, o grau ponderado médio e a modularidade – esta última responsável pela formação dos clusters nos grafos, uma espécie de grupos de interesses comuns. Essas métricas foram executadas e, em seguida, a aparência dos nós foi configurada de acordo com a modularidade e o grau de entrada ponderado. Além disso, os rótulos – ou nome dos nós – foram exibidos e tiveram o tamanho ajustado. Depois, foram escolhidos os seguintes tipos de distribuição para personalizar o grafo: Force Atlas 2, OpenOrd, Yifan Hu e Expansão. 

Por fim, Janderson Pereira apresentou também a aba de Laboratório de Dados do Gephi, que mostra o conjunto de dados em formato de tabela, e a aba de Visualização, que corresponde a etapa final da construção do grafo, onde são feitos os ajustes finais para sua exportação e exibição.

NÍVEL

Básico.

DURAÇÃO

1:30h

Referências da atividade

janderson

Janderson Pereira

Cientista de dados e coordenador de inovação e previsão na Natura & Co. É pesquisador do Citelab/UFF – Laboratório de Investigação em Ciência, Inovação, Tecnologia e Educação e graduado em Estudos de Mídia/UFF. Desenvolve pesquisas na área de análise de redes sociais, com foco em metodologias de disseminação de desinformação em sites de redes sociais.

REALIZAÇÃO

DESENVOLVIDO COM

APOIO

APOIO DE MÍDIA

Visite os sites das edições anteriores: 2016201720182019 e 2020