Image for post
Image for post
Photo by sergio souza on Unsplash

It was in August of the fateful year 2020 that I wrote a text right here in the Medium showing the findings of a model of clusters of municipalities from variables related to GDP. The time has come to visit that model again and make new experiments. Here the reports will focus on findings that are easily interpreted in visual mode.

The idea is to detail the clusters in distribution graphics and maps. With the help of the XKCD astronomical inspiration and its black-silver palette, we assembled the graphics, solving at least visually the distribution problems of the variables.

The galaxies, the nebulae and the logarithms

The…

Image for post
Image for post
Photo by Andre A. Xavier on Unsplash

A tragedy of 5570 cities in maps and graphs

Last friday, 02/26/2021, marked one year since the first recorded case of COVID-19 in Brazil. In this period the accumulated statistics of cases and deaths are frightening. The country is second in the total number of deaths from the disease according to the WHO, and third in the total number of cases. The numbers when viewed more closely can be even more terrifying.

When looking at the Brazilian municipalities we realize that in several of them the number of deaths from COVID-19 is already approaching the total number of deaths in the average of what was observed in these places…

Image for post
Image for post
Photo by sergio souza on Unsplash

Foi em agosto do fatídico ano 2020 que escrevi um texto aqui mesmo no Medium mostrando os achados de um modelo de agrupamentos dos municípios a partir de variáveis relacionadas ao PIB. Chegou o momento de voltar a visitar aquele modelo e fazer novas experiências. Aqui os relatos vão ser focados em achados que se interpretam facilmente no modo visual.

A ideia é detalhar os grupos em gráficos de distribuição e em mapas. …

Image for post
Image for post
Anunciação de De Fray Angelico — Galería online, Museo del Prado., Dominio público, https://commons.wikimedia.org/w/index.php?curid=45124868

Título deliberadamente inspirado na música de Alceu Valença

Texto originalmente publicado em 26/08/2019, na Revista Fórum

E ocorreu o primeiro panelaço. Após pouco menos de oito meses de novo governo, eis que na penúltima sexta-feira do mês de agosto as varandas da classe média deram a primeira demonstração de perda de paciência com o Planalto. O motivo foi os incêndios na Amazônia e os sinais que isso estava perto de ocorrer estavam disponíveis no Twitter já há alguns intervalos de hashtags.

Munidos do nosso ferramental de análises, baixamos e analisamos tuítes que traziam sinalizações de que o público do twitter…

Image for post
Image for post
Ponte Vecchio — Firenze. by Fernando Barbalho

Texto publicado originalmente em 30/12/2019, na Revista Fórum

Em 2020 a obra completará 700 anos. Durante todo esse tempo a Divina Comédia vem influenciando leitores, autores, políticos e pessoas comuns. Passou por várias mídias, do livro impresso à música, do teatro aos games contemporâneos. Como não poderia deixar de ser, está presente também no Twitter e não à toa um robô se dedica a recolher qualquer referência à Divina Comédia feita na plataforma e em seguida faz o retuíte.

Utilizando recursos de programação fizemos um apanhado dos textos da curadoria do robô. São 3200 tuítes que foram publicados entre 12/09/2019…

Image for post
Image for post
Photo by Gary Butterfield on Unsplash

Pouco mais de seis meses desde o início da pandemia de COVID-19, o Brasil ainda caminha de maneira imprecisa quanto ao desfecho de uma crise sanitária, econômica e psicológica. Ao longo deste conturbado período, os posicionamentos em defesa da ciência foram importantes para marcar posições acerca da adoção das medidas sanitárias de distanciamento social. Cientistas de todos os campos do conhecimento entraram no debate público afirmando algo que até então parecia óbvio: é através da lente da ciência que devemos enfrentar esta e as próximas pandemias.

Diante de tantos debates acalorados, a equipe do Dadoscope pensou que seria importante descobrirmos…

Image for post
Image for post
Photo by Марьян Блан | @marjanblan on Unsplash

Riqueza, pobreza, territórios maiores do que países, quase povoados, populações enormes, agropecuária, indústria e serviço. O que todos esses elementos tem a nos dizer quando estão presentes em mapas que mostram os municípios do Brasil? Essa parece ser uma história interessante de ser contada. Principalmente em ano de eleições municipais. Principalmente quando vivemos a maior pandemia dos últimos cem anos trazendo impactos sociais e econômicos nada alentadores.

Aqui, dados abertos brutos de difícil análise são ressignificados através de mapas coloridos e intuitivos. Percebe-se daí as contradições regionais, os movimentos econômicos atuais e os aglomerados territoriais que contribuem nos agrupamentos econômicos…

Image for post
Image for post
Photo by LOGAN WEAVER on Unsplash

Já é possível perceber a disseminação do debate sobre as subnotificações de casos de COVID-19. O interesse pelo tema deixa seus rastros no Google. A figura logo abaixo, por exemplo, mostra a curva de tendência no google trends para a palavra subnotificação.

Image for post
Image for post
Photo by Marcos Paixão on Unsplash

Atenção: O Governo Federal emitiu comunicado indicando que a base de dados inicialmente divulgada tratava-se dos meses de Novembro e Dezembro de 2018 e não Novembro e Dezembro de 2019. Essa informação já está refletida no texto.

No início da semana passada foi publicada a base de dados de pensionistas do poder executivo federal. Essa publicação é resultado de uma decisão do Tribunal de Contas da União (TCU) que acatou uma denúncia da agência de dados independente Fiquem Sabendo para abertura de dados de pagamentos a pensionistas. …

Image for post
Image for post
Photo by The New York Public Library on Unsplash

Semana passada fui instrutor na ENAP de um treinamento em introdução à Ciência de Dados para uma turma da Receita Federal do Brasil (RFB). Como era de se esperar, focamos sobre objetos de negócio dessa instituição. Baixamos dados abertos da série temporal de receitas administradas pela RFB arrecadadas em todos os municípios brasileiros, fizemos alguns tratamentos e descobrimos algumas possibilidades de clusters, que são o fio da meada dessa storytelling que foi o objetivo da aula final do treinamento. Eis aqui o que eu e a turma temos para contar.

O caos inicial da análise

A primeira figura que nos aparece quando se tenta fazer…

Fernando Barbalho

Doctor in Business Administration from UNB (2014). As data scientist, researches and implements products for transparency in the Brazilian public sector.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store