* Tradução do artigo ‘Mapping coronavirus, responsibly’ publicado em fevereiro de 2020 por Kenneth Field, gentilmente cedido pelo autor para publicação em português na Escola de Dados. Os destaques em negrito e comentários entre chaves foram feitos na tradução.

Vivemos tempos maravilhosos no que diz respeito à cartografia. A tecnologia permite e apoia ativamente a produção de mapeamentos de forma rápida e democrática. Os dados, compilados e publicados quase em tempo real (se não em tempo real), incentivam as pessoas a se envolverem para ver o que são capazes de fazer. Todos os meios de comunicação se apressam para fornecer ao público conteúdo rápido e visível. A mídia social impulsiona o compartilhamento desses mapas em um ritmo impressionante. Quando você conta uma história (que está em desenvolvimento) sobre saúde humana , os ingredientes estão prontos para que os mapas tomem protagonismo, tal como tomaram, com o surto de coronavírus em andamento. Vamos dar uma olhada em como os mapas podem ajudar a moldar a narrativa e, à medida que a preocupação (medo?) cresce, como mapear os dados de maneira responsável.

Até o momento (25 de fevereiro de 2020), o coronavírus (Covid-19) infectou mais de 77.000 cidadãos chineses, principalmente na província de Hubei, desde que foi identificado pela primeira vez em dezembro de 2019. Até agora, já se espalhou para mais de 30 países. O vírus já matou mais de 2.600 vidas e foi declarado uma emergência de âmbito internacional pela Organização Mundial da Saúde (OMS).

Na série de mapas a seguir, vamos nos concentrar apenas nos dados da China. Eles foram desenhados como mapas triviais, que você poderia encontrar em um site de notícias. Relativamente simples e apenas com os fatos principais. Muitos dos problemas que comentarei são igualmente aplicáveis ​​se você estiver criando um pequeno mapa estático ou um mapa interativo na web.

O primeiro trabalho ao fazer qualquer mapa é determinar qual projeção você usará. A região é a China e os dados serão temáticos. Para que QUALQUER mapa com dados populacionais, o mapa deve usar uma projeção equivalente ou de igual área. [NT: saiba mais no verbete sobre projeção equivalente na Wikipedia]. Uma boa opção para a China é a projeção de Albers. A Web Mercator não ajuda no propósito do mapa, pois as distorções levam as pessoas a superestimar ou subestimar o tamanho das áreas em relação umas às outras. Isso tem o efeito de disseminar cada vez mais as impressões pessoais distorcidas por causa de um exagero – para mais ou para menos – de partes do mapa, devido simplesmente à projeção utilizada.

O Projection Wizard é uma ótima ferramenta para ajudar a elaborar uma boa projeção para seus dados [NT: para a região do Brasil com projeção de áreas iguais, o site sugere a “Equatorial Lambert azimuthal equal-area”]. Além disso, fazer mapas em uma projeção adequada é fácil em sistemas desktop de informações geográficas (GIS). Também é muito simples se estiver criando um mapa na web usando o ArcGIS, como este blog já explicou anteriormente. Aqui está uma comparação de como o mapa fica em uma escala de 1:30 milhão para a mesma área da projeção de Albers [em azul] e Web Mercator [em vermelho]. Veja como são diferentes!

Depois de identificamos uma projeção apropriada, agora, todos os mapas serão feitos dessa maneira para mantermos uma coerência. Isso ajuda não apenas a comparação dentro de cada mapa, mas também entre eles.

A técnica de mapeamento temático padrão, com a qual a maioria das pessoas está familiarizada, é o mapa coroplético (cores graduadas). É uma ótima técnica quando usada corretamente, mas quando mal utilizada tem a capacidade de equivocar as pessoas. Aqui está um aparente mapa coroplético razoável dos dados do coronavírus a partir de 24 de fevereiro de 2020. Essa é a data que usaremos para todos os mapas. Alerta de spoiler: é assim que não se faz este mapa.

A aparência pode ser enganosa. O fato de que ele parece “okay” está escondendo um segredo sombrio que, se você não estiver ciente, nem será notado. O mapa está usando totais (valores absolutos) como dados brutos. Existem pouquíssimas regras de ouro na cartografia e esta é uma delas: você não pode mapear valores totais usando a técnica  de mapeamento temático coroplético. O motivo é simples: cada uma das áreas no mapa tem um tamanho diferente e tem um número distinto de pessoas. Eles são inerentemente desiguais em suas características, portanto primeiro precisamos lidar com isso antes de entender os outros dados. Essas características inatas de todos os mapas temáticos [NT: saiba mais no verbete sobre mapas temáticos] significam que você simplesmente não pode fazer comparações de igual para igual em um mapa coroplético.

A legenda nos diz que a região de Hubei tem mais de 65.000 casos de coronavírus. Parece muito, porém existem 100 mil ou 100 milhões de pessoas vivendo em Hubei? E o que dizer das regiões vizinhas? Teriam um número semelhante de pessoas morando lá? Ou muito mais? Ou muito menos? Como não temos como saber, a comparação do tema do mapa é impossível. Simplesmente não sabemos onde realmente há menos ou mais, porque não há uma linha de base consistente para a comparação. Tudo o que temos é um número total, e poderíamos ter usado uma tabela para isso.

E o esquema de classificação usado no mapa? Parece que 1.000 casos estão sendo usados ​​como o limiar máximo da série de cores. Existem 5 províncias na categoria mais alta, portanto partimos do princípio que eles tenham números igualmente altos, certo? A única maneira de ver o que realmente está acontecendo é observar a distribuição de dados. Aqui está um gráfico de barras do número de casos da província chinesa.

A situação de Hubei é um caso atípico, um número muito grande que o mapa acima não reflete corretamente. Todas as outras regiões estão bem abaixo desse nível. Portanto, usar o marco de 1.000 casos é uma escolha errada, já que Hubei se confunde com seus quatro vizinhos mais próximos em termos de valores de dados, apesar de não estarem nem perto do mesmo. Uma coisa que você pode fazer neste momento é considerar o uso de um gráfico de barras em vez de um mapa, por mostrar com clareza as dimensões empíricas e geográficas sem escondê-las atrás de uma projeção que precisa de interpretação cuidadosa. De qualquer forma, aplique esse conhecimento ao mapa. Aqui está uma versão melhorada exatamente com os mesmos dados.

Mudamos de um esquema de cores vermelho para um verde-azulado. Por que isso, se as pessoas gostam de mapas vermelhos? Bem, isso pode ser verdade – eles certamente chamam mais atenção – mas considerem o conjunto de dados. Estamos mapeando uma tragédia da saúde humana que pode piorar muito antes de desaparecer. Nós realmente queremos que o mapa esteja gritando em vermelho vivo? O vermelho é uma cor muito emotiva, tem significado. Pode facilmente significar perigo e morte, o que ainda é estatisticamente muito raro para o coronavírus [NT: Importante relembrar que o texto foi escrito ainda um estágio inicial da pandemia global, em fevereiro de 2020]. Ainda podemos fazer o mapa revelar a mesma mensagem, mas sem opções sensacionalistas de cores. Um simples esquema de cores claro-escuro faz o trabalho para que as pessoas possam avaliar melhor.

A outra grande diferença com o mapa é que foi corrigido o uso de totais para serem usadas as taxas no lugar. O mapa agora está normalizado para apoiar uma comparação visual precisa, porque 10 casos em uma cidade de 100.000 habitantes é uma situação completamente diferente de 10 em uma cidade de 100. Hubei tem 111 casos a cada 100.000 moradores. Todas as outras regiões têm menos de 3 casos a cada 100.000 – significativamente menos. A classificação dos dados, o próprio mapa e a legenda de suporte agora refletem essa disparidade muito grande e, como usamos taxas, temos uma linha de base consistente e podemos comparar o que vemos de um lugar para outro no mapa. As cores são pouco expressivas para todas as regiões exceto Hubei, para permitir que ela se destaque um pouco mais e torne óbvio que se trata de um ponto fora da curva (outlier). O rótulo adicional apoia a história e ajuda a levar o leitor ao aspecto crucial do mapa.

O mapa coroplético não é a única técnica útil e, embora este blog não seja o local para uma exposição completa de todas as alternativas possíveis, quais outras escolhas simples podemos fazer (ou não) para mostrar os dados? Primeiro, um mapa de densidade de pontos.

Aqui, podemos usar totais em vez de taxas porque a própria técnica renderiza automaticamente os dados como uma densidade visual de pontos do mesmo tamanho, que ajuda na comparação. Nesse mapa, um ponto é igual a 10 casos. Os pontos são posicionados aleatoriamente e enfatizam os valores enormes em Hubei. A desvantagem é que alguns podem inferir que um ponto localiza um caso individual, por isso é sempre útil incluir uma nota para esclarecer qualquer possível confusão sobre como ler os símbolos do mapa. Devido à grande variação dos dados, é quase impossível obter o valor do ponto para fornecer as contagens inferiores ao mesmo tempo das contagens mais altas. Hubei parece estar completamente sobrecarregada, porém isso é exatamente o que o mapa deve mostrar em comparação com as áreas ao redor.

Outro tipo de mapa temático muito útil é o mapa de símbolos proporcionais. Novamente, esse tipo de mapa pode assumir números absolutos como dados de entrada e usa os valores dos dados para calcular a área de um símbolo, aqui um círculo, que é proporcional e comparável entre si.

Alguém notou que nos mapas coroplético e de densidade de pontos é impossível ver Hong Kong ou Macau? Em escala nacional, e para um país tão grande, é inevitável que pequenas áreas sejam negligenciadas. Você pode usar uma inserção ou se apoiar nas características “multi-escalas” de um mapa da web, mas um mapa proporcional de símbolos permite ver áreas menores em virtude do próprio símbolo. Exceto por termos esse valor muito grande,  se dimensionarmos nossos símbolos linearmente, todas as regiões – menos Hubei – terão o mesmo tamanho pequeno de símbolo.

Como alternativa, podemos usar símbolos graduados, onde um intervalo de valores é ajustado a um conjunto de símbolos de um tamanho específico (símbolos graduados). Ou podemos modificar a forma como os símbolos proporcionais são dimensionados, como usar uma escala logarítmica em vez de uma escala linear, tal como exemplificado no mapa abaixo.

No processamento de dados, a legenda é essencial  para fornecer aspectos da distribuição de dados sempre que se faz algo fora do comum. Certamente ganhamos muito mais variações no tamanho dos símbolos no mapa com essa abordagem, embora visualmente corramos o risco de enfatizar demais valores pequenos em comparação com os valores gigantescos. Como em qualquer mapa de símbolo proporcional, é vital evitar símbolos sobrepostos. Reposicioná-los pode ajudar, assim como um mapa da web multi-escala, onde os símbolos são desagregados ou desagrupados à medida que você aumenta o zoom. Uma outra abordagem seria criar um mapa híbrido, talvez usando a densidade de pontos para todas as áreas, exceto Hubei, que receberia um símbolo proporcional.

Para encerrar, alguns exemplos de mapas fáceis de criar. Mas poder não significa que você usá-los. Em primeiro lugar, o chamado ‘mapa de calor’.

Na realidade, esse tipo de mapa é apenas uma superfície interpolada usando os valores de dados em pontos que representam as áreas no mapa. Existem algumas desvantagens: as províncias chinesas são enormes e o centro geométrico não é necessariamente o melhor local para fixar o valor dos dados. Poderíamos posicionar os pontos usando uma técnica ponderada por população, mas mesmo assim – com os dados do coronavírus sendo muito específicos de cada localização – usar um interpolador para assumir algum tipo de variação gradual entre os pontos de dados adjacentes, que estão distantes e representam uma geografia altamente generalizada, não ajuda. O mapa apresenta uma imagem da distribuição de dados que não está amparada nem pela geografia, nem por ele mesmo. Além disso, o mapa não mostra realmente Hubei como o epicentro. É super generalizado. E as cores? Uma péssima escolha que se volta para um território sensacionalista, pois a China parece consumida pelo vírus ectoplasmático. Simplesmente não é o caso, então não vamos fazer mapas como esse.

Ok, mas e o 3D? As pessoas adoram 3D.

O 3D tem lugar e hora. Pode ser uma maneira muito útil de codificar dados temáticos no eixo | e criar algo proveitoso. Entretanto, a extrusão de Hubei em comparação com o restante das áreas simplesmente não funciona para esses dados. É gratuito e não acrescenta nada. É realmente difícil entender as quantidades relativas antes mesmo de lidarmos com escorços e oclusões, mas falar brevemente sobre cenas em 3D me traz de volta à ideia de interação e mapas na web.

Os mapas na web são um jeito fantástico de mapear para compartilhar rapidamente. Eles são um componente vital na maneira como as pessoas partilham dados, oferecendo muitos recursos úteis além dos mapas estáticos – como imagens panorâmicas, zoom e clicar em eventos que geram pop-ups. Tudo muito útil, mas que vem com seu próprio conjunto de eventuais problemas. Por exemplo, um mapa proporcional com símbolos de tamanho fixo, quando diminuído, une os símbolos em uma mancha. Quando o zoom é ampliado demais, é fácil para as pessoas assumirem que o símbolo exibido representa um local preciso, em vez de um centro geométrico da área muito maior do que ele representa abstratamente. Aumente o zoom de um mapa coroplético e você preencherá sua tela com uma única cor, implicando totalidade e removendo-a do contexto circundante. Aumente o zoom de um mapa de densidade de pontos e você verá pessoas pensando que um único ponto que foi posicionado aleatoriamente perto de uma casa é onde alguém realmente vive. Essas são mensagens que seu mapa não deve sugerir.

Portanto, é realmente importante restringir seus níveis de zoom para evitar situações extremas em escalas pequenas ou grandes, se os dados não suportarem essa granularidade ou se você não tiver nenhum dado diferente e mais detalhado para mudar ao ampliar a imagem em escalas maiores . E se você estiver usando símbolos proporcionais ou de densidade de pontos, faça com que seus símbolos sejam redimensionados em diferentes níveis de zoom para superar os problemas associados à simbologia de escala fixa. Lembre-se de que dados como os das províncias e agregações de países para coronavírus são uma média para uma região inteira. É impossível obter uma visão sobre as circunstâncias locais, surtos e grupos. Os dados não suportam essa análise, então restrinja o mapa de dar a entender isso, por meio de decisões de design significativas, e não ofusque a realidade dos limites dos dados.

Também é fundamental permanecer crítico enquanto estiver lendo esses tipos de mapa. Estar mais esperto com o que você vê neles ajuda a identificar quando você padrões que são tanto, senão mais, um produto do mapa que é mediador da mensagem do que dos dados em si. “Caveat emptor” [NT: em latim, “cuidado, comprador”]  se aplica tanto à leitura de um mapa quanto à compra de uma casa. O mapa pode parecer deslumbrante e atraente, mas, uma vez que você entra, pode encontrar todos os tipos de defeitos estruturais que limitam seu uso prático. E você não compraria uma casa que tem a fundação desmoronada e paredes infestadas de cupins, apesar do cheiro de tinta fresca que exala enquanto caminha pelo espaço. Ser capaz de identificar algumas das falhas no que você está vendo – independentemente de quão autoritário ou definitivo é seu pensamento – ou que lhe digam como o mapa está, ajudará você a ser um consumidor mais inteligente de informações.

Essa é uma rápida explicação de algumas idéias para ajudar a mapear dados como os do novo coronavírus de forma responsável, e também de como identificar quando o mapa talvez não esteja sendo tão responsável quanto poderia ser para comunicar algo a você, consumidor de mapas. Frequentemente, as técnicas mais simples, bem feitas, fornecem uma abordagem cartográfica sólida. A chave para informar é trabalhar com os dados e não impregna-los com simbologia ou processamento de dados equivocados ou sensacionalistas, além de lidar com alguns dos problemas cartográficos pelos quais as técnicas são conhecidas. E quais são os pontos principais? Partindo dos dados de 24 de fevereiro:

  • Hubei tem 111 casos por 100.000 habitantes (0,1% da população);
  • Em todo o resto da China há menos de 2,5 casos por 100.000 habitantes;
  • Para outros países que relatam casos, a taxa é ainda mais baixa; 
  • Os mapas mediam a mensagem em maior ou menor grau, e alguns que parecem bem-intencionados geralmente são inúteis.

Talvez as palavras sejam tudo o que você precisa?  Mas, se for criar um mapa, pense nesses aspectos-chave, escolha uma técnica que apoie a narrativa dessa história, processe os dados, escolha símbolos adequados e evite fazer um mapa que desorienta, desinforma ou tem o potencial de se tornar viral como um exemplo de #cartofail.

Que mapa eu faria? Para esses dados … símbolo proporcional em escala logarítmica, com um esquema de cores claras a escuras para acentuar os símbolos. Como alternativa, eu poderia colocar apenas rótulos proporcionais em um mapa ou, ao invés disso, simplesmente usar uma tabela ou gráfico.

SOBRE O AUTOR

Kenneth Field

Ken é um “cartonerd” profissional com bacharelado em cartografia e doutorado em SIG e geografia da saúde. Ele é um ex-acadêmico do Reino Unido, mas, desde 2011, ele fala e escreve sobre cartografia, dá aulas e ocasionalmente faz mapas – com Esri – em climas muito mais ensolarados. Apresentou e publicou horrores e está na ativa como orador e palestrante. Tem um blog (cartonerd.com), um Twitter (@kennethfield), foi editor do The Cartographic Journal (2005–2014) e atual presidente da Comissão de Design de Mapas da ACI (mapdesign.icaci.org). Ele ganhou alguns prêmios por mapas, pedagogia e projetos de azulejos de cozinha. Ele é autor do livro best-seller CARTOGRAPHY e recentemente deu um curso online sobre cartografia para mais de 110.000 pessoas interessadas em fazer mapas melhores. Ele anda de snowboard, toca bateria, constrói Lego e torce para o Nottingham Forest.

* Tradução por Murillo Antonini. Revisão por Adriano Belisário e Murilo Ely.