quinta-feira, 5 de julho de 2012

Análise dos salários da União II

Durante a noite consegui carregar mais alguns dados e atingi o total de 29.795 contracheques, dos quais 27.375 têm valor maior que zero. Isso representa 5,2% do total. Tenho que estudar um pouco de estatística para poder derivar alguma conclusão sobre as propriedades dessa amostra, mas acho que os 2,6% já me bastavam.

Então, vou comparar os dados anteriores com os novos:
  • A média saltou de R$6.519,22 para R$6.608,88 (pouco mais que 1% de diferença);
  • A mediana subiu para R$4.384,67 para R$4.837,66 (0,06% de diferença!);
  • Os 10% maiores ganham a partir de R$13.611,62 (3% sobre os R$13.184,85 anteriores) e
  • O coeficiente de Gini mudou de 0,368 para 0,374.
Os salários abaixo de R$2.000,00 representam 4,2% do total. Os menores de R$3.000,00 são 21%.
Separei os salários em faixas de R$2.000,00 para melhor visualizar a distribuição:

Porcentagem na faixaPorcentagem acumuladaFaixa
4,26%4,26%R$1 a R$2.000
35,5%39,76%R$2.001 a R$4.000
19,29%59,05%R$4.001 a R$6.000
13,55%72,60%R$6.001 a R$8.000
8,45%81,05%R$8.001 a R$10.000
6,22%87,27%R$10.001 a R$12.000
3,11%90,38%R$12.001 a R$14.000
2,55%92,93%R$14.001 a R$16.000
2,28%95,21%R$16.001 a R$18.000
3,02%98,23%R$18.001 a R$20.000
0,95%99,18%R$20.001 a R$22.000
0,60%99,78%R$22.001 a R$24.000
0,13%99,91%R$24.001 a R$26.000
0,06%99,97%R$26.001 a R$28.000
0,01%99,98%R$28.001 a R$30.000
0,01%99,99%mais de R$30.001

As porcentagens não somam 100% porque foram arredondadas. A última faixa (mais de R$30.001) representa apenas 4 pessoas (0,0146%).

quarta-feira, 4 de julho de 2012

Análise dos salários da União

Há poucos dias a União publicou sua folha salarial no portal da transparência. É mais de meio milhão de contracheques de servidores federais. Acho que publicar os nomes foi um pouco excessivo e desnecessário; ao mesmo tempo acho que faltaram informações mais interessantes para a sociedade.

Então, armado de um script em Perl, procurei levantar as informações que me parecem importantes. Usei o módulo WWW::Mechanize para percorrer as páginas e processá-las, já que a União não foi transparente o suficiente para publicar uma planilha, um XML, ou mesmo um arquivo-texto. Não vou publicar o código para não facilitar a vida de pessoas com objetivos menos nobres que os meus.

Minha estimativa inicial era a de que seriam necessárias 32 horas para processar todas as páginas, mas logo minhas conexões começaram a cair, mesmo eu sendo um bom cidadão, abrindo apenas uma conexão por vez.

Com apenas dados de 14.885 servidores federais (2,6% do total de 569,6 mil), pensei ter o suficiente para já calcular algumas estatísticas. Desses, 1.209 tinham salário zero no mês e eu os ignorei.

A média é de R$6.519,22, mas a mediana é de apenas R$4.834,67 (ou seja, metade ganha menos que isso e metade ganha mais). O coeficiente de Gini é quase 0,368. Isso é bastante melhor que o valor nacional de 0,519, mas ainda é pior que o de países mais avançados (o da França é 0,289 e o da Alemanha é 0,27).

Para complementar os salários dos que ganham menos de R$2.000,00, seria necessário retirar apenas 1% dos salários dos que estão entre os 10% maiores (são os que ganham mais de R$13.184,85). Para que ninguém recebesse um salário bruto menor que R$3.000,00, seria necessário retirar apenas 7% dos salários mais altos. Eu não considerei as cargas horárias, mas achei que 82% dos que ganham menos de R$2.000,00 fazem 40 horas semanais, assim como 86% dos que ganham menos de R$3.000,00.

Os 10% maiores salários correspondem a 27% do total da folha. Os 10% menores correspondem a pouco menos que 3% da folha. A média de IRPF é de 9,3% do salário bruto; considerando somente os que pagam IRPF, a média sobe apenas para 10%. Isso não chega a surpreender, porque apenas 7% não pagam imposto de renda. Os 10% maiores salários contribuem com 40% do total de IRPF pago, descontando, em média, 19,7% do valor bruto.

Faltam informações sobre idade e sexo dos funcionários. Evidentemente, publicar essas informações seria uma inequívoca invasão de privacidade e não espero que o façam, mas torço que comecem a compilar estatísticas para melhor informar a sociedade. Assim como foram publicados os dados, não vejo grande utilidade neles, exceto para encontrar uma ou outra ilegalidade que tenha escapado ao TCU. Ou então para propiciar algumas horas de diversão para um velho programador de Perl.