Março/2023

AGENDA

Oportunidades e prazos para não perder de vista


12/04 – Cerveja com Dados em Fortaleza. O evento é gratuito e as inscrições estão abertas neste formulário. Caso queira, você também pode fazer parte do grupo do Cerveja com Dados Fortaleza no WhatsApp.

14/04 – Início da especialização remota em Educação Midiática, uma parceria entre Agência Lupa com a Universidade do Vale do Rio dos Sinos (UNISINOS). Inscrições abertas

14 a 15/04 – 24ª edição do International Symposium on Online Journalism, em Austin, no Texas.

18 a 19/04 – Acontece a User QGIS Conference, na Holanda. 

18/04 – No aquecimento da csv,conf, a Open Knowledge Foundation propõe o Frictionless Dating, evento presencial em Buenos Aires para promover o networking entre pessoas dos campos de dados abertos, tecnologia cívica e padrões abertos. 

19 a 20/04csv,conf,v7 ocorre presencialmente em Buenos Aires, na Argentina,  e terá compartilhamento de experiências sobre de análise de dados para ciência, jornalismo, governo e fontes de dados.

21/04 – Prazo das inscrições para o JournalismAI Fellowship Program, que ocorrerá entre os meses de junho e dezembro de 2023. 

23/04 – Data limite para inscrições de palestras no Festival de Datos, que acontecerá de 7 a 9 de novembro em Punta del Este, no Uruguai.

25/04 – Data final para a inscrição em vaga de trabalho acadêmico na Universidade de Edimburgo, Reino Unido, no programa Lecturer or Reader in Computational Social Science

02/05 – Aberto processo seletivo para a Especialização em Geoprocessamento pela Universidade Federal do ABC (UFABC) e Universidade Aberta do Brasil (UAB). O curso é à distância e gratuito. 

03 a 05/05 – A Outlier Conference acontece em Porto (Portugal), com diversos agentes da comunidade de dados

05/05 – Prazo para submeter trabalhos para Computers, Privacy and Data Protection Conference (CPDP LatAm)

05 a 07/05 – O Festival3i2023, festival de jornalismo inovador da América Latina organizado pela Ajor (Associação de Jornalismo Digital), ocorrerá presencialmente no Rio de Janeiro.

09 a 11/05 – A Data23, conferência da Tableau, acontecerá em Las Vegas. 

10 a 12/05 – A JupyterCon reunirá, em Paris, na França, desenvolvedores, pesquisadores, educadores, cientistas de dados, entre outros, para debater acerca do ecossistema Jupyter.

18/05 – A Spatial Data Conference acontece presencialmente em Londres e em Nova Iorque. 

05 a 08/06 – 12ª edição da RightsCon acontece online e na Costa Rica. 

22 a 24/06European Data & Computational Journalism Conference acontece em Zurique, na Suíça.

29/06 a 02/0718º Congresso Internacional de Jornalismo Investigativo acontecerá em São Paulo (SP), organizado pela Abraji.

31/08 e 01/09 – 2ª edição do Coda Amazônia, em Belém, no Pará.

02/09 – Atividades do Coda Amazônia na Ilha de Marajó.

17/09 a 20/09 – Período da posit::conf2023, oportunidade de integração da comunidade de ciência de dados. 

07 a 09/11Festival de Datos acontece de 7 a 9 de novembro em Punta del Este, no Uruguai.

NO MUNDO DOS DADOS

Notícias e discussões quentes


Precisamos falar sobre ChatGPT
Não foram poucos os artigos publicados mundo afora sobre os impactos que as ferramentas de inteligência artificial podem provocar no contexto social. Para Emily Bell, diretora do Tow Center for Digital Journalism na Universidade Columbia e colunista do The Guardian, tecnologias como Sydney (IA do Bing, da Microsoft), e o ChatGPT, podem trazer consequências desastrosas também para o jornalismo. Isto porque ferramentas como estas podem criar em segundos uma quantidade absurda de vídeos, fotos, e textos que parecem ser escritos por humanos, mas sem qualquer compromisso com a verdade. Em seu artigo “Um frenesi de notícias falsas: por que o ChatGPT pode ser desastroso para a verdade no jornalismo” (na tradução livre), ela traz uma afirmação preocupante: “se quisermos evitar os terríveis erros dos últimos 30 anos de tecnologia de consumo – desde as violações de dados do Facebook até a desinformação não verificada que interfere nas eleições e provoca o genocídio – precisamos urgentemente ouvir as preocupações dos especialistas que alertam sobre possíveis danos”. 

Uso consciente de IA no jornalismo
A utilização das inteligências artificiais no jornalismo também vem sendo debatida em vários eventos. No dia 14 de abril, por exemplo, a abertura do 24º Simpósio Internacional de Jornalismo Online (ISOJ), da Universidade do Texas, em Austin, será dedicada a discutir o tema. O painel “Como o jornalismo pode incorporar IA, incluindo ferramentas generativas como ChatGPT e Bard, para melhorar a produção e distribuição de notícias”, que acontece no formato híbrido, propõe testar algumas ferramentas em atividades voltadas para o auxílio no cotidiano do jornalismo. O ChatGPT poderia, por exemplo, baseado nas reportagens publicadas por determinado veículo, criar um resumo dos últimos acontecimentos da Guerra na Ucrânia, com textos diferentes para quem está mais ou menos familiarizado com o assunto. 

Conhecimento Aberto no MozFest2023
A definição de “aberto” (de conhecimento aberto e dados abertos, por exemplo) foi um processo colaborativo liderado pela Open Knowledge Foundation que criou um consenso entre especialistas ao definir abertura em relação a dados e conteúdo. Usado há mais de uma década, o conceito está sendo repensado e atualizado para abarcar os contextos e desafios atuais. Neste ano, durante o MozFest2023, a Open Knowledge Foundation (OKFN) conduziu uma sessão prática de criação de um documento sobre o que, por que e como a definição de aberto deve ser revisada. Com participação de pessoas de várias partes do mundo, a sessão foi dividida em salas em inglês, português e espanhol para debates sobre o conceito, e parte da equipe da Open Knowledge Brasil se juntou às discussões. O resumo da discussão e as medidas que vieram das reflexões propostas podem ser encontrados neste post no blog da OKFN.

SAIBA MAIS

Para aprender mais e aprender sempre


Retrato do Jornalismo Brasileiro

Neste ano, a Énois Laboratório de Jornalismo conduz um estudo para buscar compreender quem produz jornalismo no país e como os profissionais deste setor trabalham, além de entender questões de gênero, raça e social dentro das redações brasileiras. A pesquisa faz parte de uma série histórica de estudo e trabalho sobre o estado da diversidade no jornalismo nacional, com 100 veículos de notícias no Brasil. Além do mapeamento, também será realizado um processo formativo para avançar a diversidade nas redações. O projeto, idealizado e coordenado pela Énois e apoiado pela Google News Initiative, será realizado pela Diversidade Corporativa, organização que aplica as metodologias e está certificada pelo Centro de Estudos das Relações de Trabalho e Desigualdades (Ceert). O prazo para inscrições vai até o dia 18 de abril.

A 6ª edição do Atlas da Notícia

No início deste mês, o PROJOR e o Volt Data Lab anunciaram a abertura de inscrições de voluntários para a 6ª edição do Atlas da Notícia, projeto colaborativo que mapeia a presença do jornalismo local no Brasil. Por meio de crowdsourcing e com apoio da Meta, a nova edição do levantamento visa atualizar o mapa dos veículos jornalísticos nos 5.570 municípios brasileiros, obter informações sobre a atividade jornalística no país e registrar abertura e fechamento de empresas de comunicação. Além de um formulário para quem quiser se voluntariar para mapear os veículos de comunicação do país, esta edição também conta com uma ferramenta que permitirá o cruzamento de dados do Atlas com outras bases de dados, ampliando o conhecimento que pode ser gerado pelo mapeamento. 

6 tipos de métodos de clusterização

No Aprendizado de Máquina, clustering é um dos ramos do aprendizado não supervisionado onde os dados não rotulados são divididos em clusters (grupos) com instâncias de dados semelhantes atribuídas ao mesmo cluster, enquanto instâncias de dados diferentes são atribuídas a clusters diferentes. Ele pode ser usado para fazer segmentação de mercado, detecção de outliers e análises de rede. No Towards Data Science, Kay Jay Wong explica sobre diferentes tipos de métodos de clustering, suas vantagens e desvantagens, apresenta-os com exemplos de algoritmo e ensina quando usá-los.

SNIPPETS

Dicas curtas e certeiras


O Núcleo Jornalismo lançou uma plataforma que destaca as notícias dos principais veículos de comunicação no Twitter.

A Abraji lançou, em parceria com a PUC-SP, um relatório de dados inéditos sobre a violência contra a imprensa brasileira, a partir do Monitoramento da Violência contra Jornalistas no Brasil em 2022.

O Tesouro Nacional disponibiliza API que produz animações acerca de dados de finanças públicas.

No mês de março, o Curso-R organizou lives sobre dicas para programar em RMarkdown/Quarto e Shiny, unboxing de pacotes do R e Web Scraping.

O GitHub explica sobre a aplicabilidade da linguagem Python, dicas de por onde começar e a utilização no Codespaces e CoPilot. 

A Global Investigative Journalism Network publica dicas e aprendizados a partir de uma entrevista com o jornalista investigativo Frederik Obermaier. 

Erdogan Taskesen escreve para o Towards Data Science sobre as semelhanças entre alguns modelos de aprendizado de máquina não supervisionado. 

Durante o mês de abril acontece o 30DayChartChallenge, que consiste em produzir uma visualização de dados por dia, durante 30 dias, obedecendo as categorias propostas. 

Marcel Pociot desenvolveu o Writeout, uma plataforma baseada em inteligência artificial capaz de transcrever e traduzir arquivos de áudio.  

A Escola de Dados organizou um webinar com o Departamento de Transparência Ativa da Controladoria Geral de Minas Gerais sobre o DPCKAN, ferramenta desenvolvida para automatizar documentações de bases de dados. 

A segunda edição do livro Python Fluente começou a ser traduzida de maneira colaborativa. Já estão disponíveis os 3 primeiros capítulos

A empresa Talarian disponibilizou no Google Workspace Marketplace, a extensão GPT for Sheets and Docs, que utiliza Inteligência Artificial para auxiliar nos trabalhos com planilhas e Documentos. 

INSPIRA

Trabalhos e iniciativas inovadoras para te inspirar


Mapa mostra criação de gado na região amazônica

“Desmatamento na Amazônia: Passado, Presente e Futuro” (em tradução livre), do InfoAmazonia, traz a história do desmatamento na região amazônica, as tendências atuais e as possíveis implicações futuras – perda de biodiversidade, impacto nas mudanças climáticas, na degradação do solo e afetando negativamente as comunidades locais e os povos indígenas. A reportagem de fôlego traz tabelas, gráficos e mapas contendo visualizações que mostram como a região estava em 2001, seu desmatamento entre 2001 e 2020, a presença das atividades que mais contribuem para o desmatamento, como a criação de gado, a mineração e construção de rodovias, além de destacar regiões que merecem atenção devido à taxa de desmatamento acelerada.  

UPDATE

Atualize-se com as novidades de softwares e bases de dados


GitHub Desktop 3.2 permite que você visualize sua solicitação de pull request. 

Já no GitHub vai ser possível implementar Code Review em Jupyter Notebooks. 

No QGIS 3.30, destacamos a mudança da integração nativa do GeoNode para um plugin externo e o aprimoramento na UX.  

Disponível LibreOffice 7.4.6 trazendo inúmeras correções de erros, possibilidade de visualizar alterações em documentos em modo apenas de  leitura no Writer, dentre outros. 

Novo script de embed do Datawrapper utiliza componentes da Web para carregar mais rápido e responder melhor na página.  

RStudio 2022.12.0 melhorou o suporte ao Python, possibilita a instalação do VSCode por padrão, incluiu R para WebAssembly, dentre outros. 

Tydiverse 2.0.0 chega com a inclusão do pacote lubridate, além de sinalizar os pacotes com conflito.