quarta-feira, 4 de julho de 2012

Análise dos salários da União

Há poucos dias a União publicou sua folha salarial no portal da transparência. É mais de meio milhão de contracheques de servidores federais. Acho que publicar os nomes foi um pouco excessivo e desnecessário; ao mesmo tempo acho que faltaram informações mais interessantes para a sociedade.

Então, armado de um script em Perl, procurei levantar as informações que me parecem importantes. Usei o módulo WWW::Mechanize para percorrer as páginas e processá-las, já que a União não foi transparente o suficiente para publicar uma planilha, um XML, ou mesmo um arquivo-texto. Não vou publicar o código para não facilitar a vida de pessoas com objetivos menos nobres que os meus.

Minha estimativa inicial era a de que seriam necessárias 32 horas para processar todas as páginas, mas logo minhas conexões começaram a cair, mesmo eu sendo um bom cidadão, abrindo apenas uma conexão por vez.

Com apenas dados de 14.885 servidores federais (2,6% do total de 569,6 mil), pensei ter o suficiente para já calcular algumas estatísticas. Desses, 1.209 tinham salário zero no mês e eu os ignorei.

A média é de R$6.519,22, mas a mediana é de apenas R$4.834,67 (ou seja, metade ganha menos que isso e metade ganha mais). O coeficiente de Gini é quase 0,368. Isso é bastante melhor que o valor nacional de 0,519, mas ainda é pior que o de países mais avançados (o da França é 0,289 e o da Alemanha é 0,27).

Para complementar os salários dos que ganham menos de R$2.000,00, seria necessário retirar apenas 1% dos salários dos que estão entre os 10% maiores (são os que ganham mais de R$13.184,85). Para que ninguém recebesse um salário bruto menor que R$3.000,00, seria necessário retirar apenas 7% dos salários mais altos. Eu não considerei as cargas horárias, mas achei que 82% dos que ganham menos de R$2.000,00 fazem 40 horas semanais, assim como 86% dos que ganham menos de R$3.000,00.

Os 10% maiores salários correspondem a 27% do total da folha. Os 10% menores correspondem a pouco menos que 3% da folha. A média de IRPF é de 9,3% do salário bruto; considerando somente os que pagam IRPF, a média sobe apenas para 10%. Isso não chega a surpreender, porque apenas 7% não pagam imposto de renda. Os 10% maiores salários contribuem com 40% do total de IRPF pago, descontando, em média, 19,7% do valor bruto.

Faltam informações sobre idade e sexo dos funcionários. Evidentemente, publicar essas informações seria uma inequívoca invasão de privacidade e não espero que o façam, mas torço que comecem a compilar estatísticas para melhor informar a sociedade. Assim como foram publicados os dados, não vejo grande utilidade neles, exceto para encontrar uma ou outra ilegalidade que tenha escapado ao TCU. Ou então para propiciar algumas horas de diversão para um velho programador de Perl.

2 comentários:

Chico disse...

Só não entendi uma coisa: comentas - em tom de queixa, me pareceu - sobre a falta dos dados de folha de pagamento num formato adequado à análise automatizada, mas omites tua aplicação de processamento automático - implementada com apoio de uma ferramenta livre - sob a alegação de precaver-se de mau uso desta. Pareceu-me contraditório, porque os dados cuja falta apontas então poderiam sofrer o mesmo mau uso, não?

forinti disse...

Eu lamento que eu não tenha acesso fácil aos dados num formato que facilite a minha vida. Ou então que o próprio governo faça uma análise dos dados. Ou então que publiquem os dados num formato simples, mas sem os nomes das pessoas. O que não quero é facilitar a vida das empresas que vendem os cadastros de consumidores e que agora vão poder associar os salários aos nomes.