Blog

#27 Privacidade, proteção de dados e algoritmos governamentais

Publicado em: 31 de agosto de 2021

#27 Privacidade, proteção de dados e algoritmos governamentais

31 de agosto de 2021

Agosto/2021

Olá,

Temos um novo benefício para você! O curso ‘Jornalismo de dados ambientais’ agora conta com certificação para quem completar as videoaulas de forma assíncrona. Como participante do programa de membresia, você pode solicitar a emissão do certificado gratuitamente. No mês que vem, abriremos a mesma possibilidade para o ‘Jornalismo de dados para coberturas locais’.

Em agosto, também lançamos uma nova formação da série Publicadores de Dados. No curso ‘Proteção de Dados Pessoais’, iremos abordar conceitos e práticas para conciliar transparência pública com o direito à privacidade, à luz das exigências da Lei Geral de Proteção de Dados.

Além disso, o primeiro curso da série – Publicadores de Dados: da gestão estratégica à abertura – foi reaberto na modalidade assíncrona. É possível também adquirir as duas formações por um preço especial.

E agora seu desconto de 20% é aplicado automaticamente em todos os cursos. Apenas garanta que você já fez o login em nossa plataforma. Não é mais necessário utilizar o cupom.

Tem mais novidade. Em setembro, teremos nosso próximo webinar do programa de membresia, abordando o projeto Operação Serenata de Amor com participação de Giulio Carvalho, coordenador do eixo de inovação cívica da Open Knowledge Brasil. Iremos compartilhar em breve a data e mais detalhes sobre a atividade.

Boa leitura e um ótimo mês de setembro!

Adriano Belisario
Coordenador da Escola de Dados

AGENDA

Oportunidades e prazos para não perder de vista


•  03/09 – Último dia de inscrições nas bolsas para inscrições gratuitas no curso “Publicadores: Proteção de Dados Pessoais”.

• 04/09 – Fim do prazo para se candidatar às vagas do curso “Análise de dados educacionais: aplicando evidências na gestão pública”.

• 05/09 – Término das inscrições na maratona de programação do Hackathon Rede +Brasil, promovido pelo Governo Federal, com premiação de até R$15 mil.

• 05/09 – Encerramento da chamada de participantes para o Programa de Formação e Estímulo ao Jornalismo de Ciência, organizado pelo Instituto Serrapilheira e a Fundação Gabo, que conta com um workshop e bolsas de até US$2,5 mil.

• 06/09 – Fim das vendas do primeiro lote de tickets para as atividades do ODI Summit 2021, que será realizado em novembro pelo Open Data Institute.

• 06/09 – Início da formação em jornalismo de dados e linguagens multimídia exclusiva para pessoas com deficiência, realizada pelo data_labe.

• 08/09 – Último dia de candidaturas para a vaga de coordenador de projeto do Diário do Clima.

• 09/09 – AI Inclusive realiza o encontro “Data Storytelling with Effective Data Visualization Techniques” com Laura Ellis, arquiteta na IBM Cloud.

• 15/09 – Prazo para envio de resumos de artigos para o #ISOJ Journal e apresentações no 22º Simpósio Internacional de Jornalismo Online em 2022. A edição aborda o uso de inteligência artificial na imprensa.

• 20/09 – Fim das inscrições para o Prêmio Latino-Americano de Jornalismo Investigativo Javier Valdez.

• 23/09 – Encerramento de inscrições na vaga de repórter de jornalismo de dados do Estadão.

• 27/09 – Bárbara Libório apresenta o workshop “Introdução ao Jornalismo de Dados”, como parte da campanha de financiamento “Não é cortina de fumaça” do projeto Elas no Congresso da Revista AzMina.

NO MUNDO DOS DADOS

Notícias e discussões quentes


Proteção de dados no Brasil e no mundo

A partir do dia 1º de agosto, as sanções previstas na Lei Geral de Proteção de Dados Pessoais (LGPD) entraram em vigor, porém, a maioria das empresas brasileiras ainda enfrenta dificuldades para se adequar à nova legislação, de acordo com levantamento divulgado pela CNN Brasil. Independente do tamanho, as empresas precisam se adaptar às exigências, como a nomeação de um responsável pela proteção dos dados, o Data Protection Officer (DPO). Segundo o levantamento, porém, mais de dois terços das firmas sequer estabeleceram uma política de proteção de dados, considerada o primeiro passo da adequação.

Por outro lado, os impactos da LGPD já são percebidos por organizações que monitoram a transparência. Diversos órgãos utilizam a nova lei como justificativa para ocultar informações outrora públicas. É o caso, por exemplo, do Tribunal Superior Eleitoral, que limitou a divulgação de dados sobre filiados políticos. A Agência Fiquem Sabendo fez uma postagem sobre os usos e abusos da LGPD por parte do governo federal e está mapeando negativas de acesso à informação baseadas na nova lei.

Já o DataPrivacyBR publicou um relatório sobre tecnologias baseadas em dados pessoais que foram utilizadas no combate à Covid-19 no Brasil. Em uma perspectiva internacional, no último mês, houve também o lançamento do livro ‘Proteção de Dados na América Latina’, que analisa os impactos da pandemia também nos países vizinhos.

Do outro lado do mundo, a China debate uma lei de privacidade e proteção de dados. De acordo com o site Protocol, se aprovado, o rascunho em discussão pode ter medidas mais rigorosas de proteção à privacidade do aquelas em vigor nos Estados Unidos.

Segurança digital para jornalistas

Privacidade também está em pauta no jornalismo. Apesar das diversas ameaças digitais contra jornalistas, a organização Freedom of the Press identificou que a maioria das universidades da área não aborda o tema em suas formações. A fim de preencher esta lacuna, foi lançado o ‘U.S. Journalism School Digital Security Curriculum’, para auxiliar o corpo docente das escolas de jornalismo a lidar com estes desafios.

Os conteúdos são modulares, então, é possível utilizar os materiais para planejar também oficinas ou atividades pontuais sobre determinados temas. Ainda que alguns conteúdos tenham com foco na realidade dos Estados Unidos, muitos outros podem ser aproveitados no Brasil.

Modelagem de ameaças, assédio online, segurança em chats, criptografia, autenticação, engenharia social, proteção de dispositivos e identificação de riscos em investigações são alguns dos temas cobertos. Cada um deles conta com recursos úteis para conduzir treinamentos, como propostas de atividades, modelos de slides e questões para debates.

Algoritmos governamentais

O Ada Lovelace Institute, AI Now Institute, e a Open Government Partnership (OGP) lançaram em agosto um relatório sobre os mecanismos legais e institucionais de fiscalização de algoritmos adotados por governos mundo afora. O relatório ‘Algorithmic Accountability for the Public Sector’ está disponível em duas versões: um resumo executivo e o documento completo.

A pesquisa apresenta uma tipologia dos principais instrumentos de controle, que vão desde o banimento de certos algoritmos a práticas de transparência, auditorias, avaliações de impactos, entre outras. Apesar de ponderar a dificuldade de avaliação dos efeitos de tais tecnologias a médio ou longo prazo, já que são recentes, o relatório apresenta também algumas lições que podem ser tiradas desta primeira onda de algoritmos governamentais.

Por falar nisso, a Alemanha publicou sua estratégia nacional de dados abertos, que também aborda temas relacionados ao uso de inteligência artificial no governo. O documento Federal Government Data Strategy traz 68 medidas previstas para os próximos cinco anos.

SAIBA MAIS

Para aprender mais e aprender sempre


Dataviz: acessibilidade e painéis 

Criador do Chartability, uma metodologia para garantir maior acessibilidades em visualizações de dados e interfaces, o pesquisador Frank Elavsky fez postagens sobre o assunto no site Observable. Uma delas aborda a importância de criar gráficos com alto contraste, tema que também é abordado no artigo “Como pessoas daltônicas enxergam as cores de seus gráficos”, que traduzimos e publicamos em nosso blog recentemente.

Já o jornalista Rogério Kreidlow publicou na Awari Insights um texto sobre os famigerados paineis interativos (dashboards). Discutindo argumentos a favor e contra, ele elenca três tendências que podem transformar esta modalidade de visualização de dados: relatórios cada vez mais parecido com notebooks; serviços com inteligẽncia artificial (IA) que constroem narrativas de dados; e, também com IA, interfaces de perguntas e respostas baseadas em dados.

Mais novidades no GitHub

Na última edição do Boletim, destacamos algumas funcionalidades interessantes do GitHub e, neste mês, temos mais novidades produzidas pela equipe do GitHub Next, o núcleo de inovação da plataforma. Agora, o time traz uma ferramenta de visualização de dados, que permite explorar de forma interativa os arquivos e informações dos repositórios, com um gráfico de bolhas como este abaixo.

Exemplo de visualização dos arquivos de um repositório no GitHub. Fonte: GitHub Next.

Outra novidade é o github.dev, uma interface de desenvolvimento de softwares integrada ao GitHub, que funciona diretamente do seu navegador. Quem já está acostumado com a interface do Visual Studio Code não deve ter dificuldades para se adaptar.

SNIPPETS

Dicas curtas e certeiras sobre o trabalho com dados


Beatriz Milz compartilhou suas anotações do curso Python para Inovação Cívica, uma análise comparada dos comandos básicos para analisar dados no Python e R.

Sem números enormes de latitude e longitude. Engenheiro do Mapbox, Vladimir Agafonkin publicou um notebook mostrando como até seis casas decimais nas coordenadas já são suficientes para a grande maioria das cartografias digitais.

Felt é uma ferramenta para mapeamento colaborativo online, atualmente na fase beta e acessível apenas mediante autorização. A empresa também tem vagas abertas para engenheiros de front-end, back-end, web apps e designer de produtos.

Vieses semânticos, nos dados, nas anotações, modelos ou no desenho da pesquisa. Estas são as cinco fontes de vieses no processamento de linguagem natural, segundo o artigo de Dirk Hovy e Shrimai Prabhumoye, que apresentam também medidas para mitigá-los.

Buscando avançar no Python? O Towards Data Science publicou uma postagem sobre indexação e como utilizar o pacote scikit-learn para aplicações de inteligência artificial.

Prefere dicas de carreira? O blog também trouxe um texto com dicas para quem deseja mudar de área e se aproximar da ciência de dados.

International Consortium of Investigative Journalists fez uma postagem sobre a importância de arquivar dados e informações, trazendo dicas para jornalistas.

Cultura e ciência de dados foi o tema de um painel online do Encontro de Estudos Multidisciplinares em Cultura (ENECULT) deste ano, que marcou também o lançamento de um livro sobre o mesmo tema.

James Long publicou o projeto absurd-sql, que permite usar SQLite diretamente do navegador para realizar registros persistentes. No post “A future for SQL on the web”, o autor explica a tecnologia.

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Neste mês, o InfoAmazônia lançou o ‘Engolindo Fumaça’, um especial guiado por dados, composto por cinco reportagens que investigam o efeito das queimadas na saúde da população da Amazônia Legal durante a pandemia da Covid-19. A série conta com visualizações de dados em mapas e gráficos, evidenciando como questões ambientais e de saúde pública estão intimamente interconectadas.

Para a empreitada, oito jornalistas passaram por cinco estados da Amazônia Legal e analisaram dados de 2020 para investigar a relação entre as queimadas e os casos de Covid-19. O resultado? Sim, a fumaça agrava a situação da Covid-19 na Amazônia.

O editorial do especial destaca que o projeto é “como um exame post-mortem realizado em grande escala”. Além das reportagens, o especial traz um painel de dados e documentações sobre a metodologia da pesquisa.

UPDATE

Atualize-se com as novidades de softwares e bases de dados


Centro Brasileiro de Análise e Planijamento (CEBRAP) disponibilizou um banco de dados sobre o desempenho do governo federal e a atuação de partidos e parlamentares no Congresso Nacional.

O Governo Federal lançou o Portal Nacional de Contratações Públicas.

Também em agosto, o IBGE publicou uma nova coleção de mapas municipais.

O Facebook AI lançou o VoxPopuli, um banco de dados com mais de 400 mil horas de falas em diversos idiomas, útil para projetos de tradução ou transcrição com inteligência artificial.

Já o AiLab da UnB mantém uma lista útil (e atualizada) de datasets em português para tarefas com processamento de linguagem natural.

A Abraji disponibilizou documentos sobre a CPI da Pandemia e inquéritos dos atos antidemocráticos na ferramenta Pinpoint (Google), que auxilia jornalistas e pesquisadores a navegar por dados em grandes volumes de documentos.

Risco de apagão? O recém-lançado pacote em R reservatoriosBR traz dados dos principais reservatórios brasileiros.

Em outubro o WorkBench será descontinuado, mas o projeto segue com código aberto. Se você tem dados lá, pode baixá-los e tentar instalar a ferramenta em seu próprio servidor.

Beekeeper Studio é um editor de SQL de código aberto, que chegou na sua versão 2.0 com várias novidades para tornar ainda mais fácil a consulta às bases de dados.

Biblioteca JavaScript para análise exploratória, o Plot 0.2.0 traz diversas novidades e em breve será adotado no site ObservableHQ.

template criado por Bruno Rocha no GitHub facilita a criação de projetos em Python, trazendo diversos recursos úteis já embutidos.

A Oracle anunciou novas funcionalidades no MySQL HeartWave, que agora emprega aprendizagem de máquina para melhorar a performance e escalabilidade das bases de dados.

versão 2.6.0 do TensorFlow irá trazer mudanças importantes, como a separação do Keras em um pacote a parte no PIP. Mas o endpoint da API no TensorFlow não será alterado.


Sugestões? Envie um e-mail para [email protected].

Deixe um comentário

O seu endereço de e-mail não será publicado.