quarta-feira, 19 de junho de 2019

Medição de Poluição em Porto Alegre II

O clima em maio e junho está realmente estranho. Fez calor e houve pouca chuva. Além disso, notei que o ar tinha cheiro de São Paulo. Ou seja, tinha cheiro de combustível. Por isso resolvi religar o meu medidor de partículas.

O ar realmente piorou desde minha última medição. Entretanto, ao menos em relação às partículas, ele continua dentro do razoável.


Uma única medição de PM10 passou do 100 (indo de satisfatório para moderadamente poluído). A medição de PM2.5 nunca passou de 44, então permaneceu no reino do ar bom.

O tempo não esteve seco durante esses dias, indo a 100% de umidade relativa todas as noites.

Deduzo que a diferença se deva à falta de chuva e à falta de ventos.

quarta-feira, 8 de maio de 2019

Atenciosamente

Acho curiosa essa forma de terminar as correspondências: Att. Querem supor que é abreviação de Atenciosamente. Não é. Além de estar errado, abreviar a saudação é o oposto de ser atencioso. É pior ainda quando está na assinatura do e-mail: o sujeito não se dá sequer ao trabalho de fingir ser atencioso.

A abreviação chega a ser irrelevante. Deveria ser proibida para esta palavra. Quem quer ser atencioso, não encurta a saudação final.

Atenciosamente,

Forinti.

sexta-feira, 22 de março de 2019

Fourier em SQL (e Perl)

Dada uma nova ferramenta, resolvi experimentar no SQL. A transformada discreta de Fourier resume-se, basicamente, a um montão de multiplicações e somas. É fácil repetir em SQL. Já a FFT nem tanto. SQL simplesmente não se presta a recursões.

Outra desvantagem do SQL é a ausência de suporte a números complexos (Perl oferece o fantástico módulo Math::Complex que, inclusive, reimplementa todas as operações da linguagem). A DFT não exige muito, basta separar a conta em cos() e i*sin(). Mas se fôssemos implementar a FFT, seria preciso fazer a multiplicação por extenso. Isso só seria chato, resolver a recursão é que é o problema do SQL.

Mesmo assim, a DFT pode ser bem útil e, se vamos usá-la num banco, é porque não estamos com pressa mesmo.

Comecei por um algoritmo FFT em Perl para poder conferir os resultados do SQL. O script executa a FFT sobre a função sin(x), assim como a consulta (que escrevi para conferir os resultados do Perl).

DFT de sin(x)

Os dois deram o mesmo resultado, mas a implementação do FFT foi muito mais rápida, como esperado.

O grande porém da FFT é que precisamos ter um número de elementos que seja potência de 2. Com DFT, podemos usar qualquer quantidade. Então, resolvi experimentar numa tabela de pagamentos.

Usei dois anos de pagamentos e obtive o seguinte gráfico (que parece indicar que há um componente trimestral nos pagamentos):


Aprender a implemenar a DFT e a FFT é só o primeiro passo. Analisar os resultados e achar aplicações é o próximo passo.

sábado, 16 de março de 2019

Desenhando para Entender

A DFT (Transformada Discreta de Fourier) é relativamente simples de entender, mas é um algoritmo de complexidade o(n2). A FFT (Transformada Rápida de Fourier) tem complexidade o(nlogn), mas é mais complicada, naturalmente.

Para ajudar minha compreensão, resolvi desenhar os valores para enxergar as zonas comuns que ajudam o FFT a acelerar as contas.

Com ajuda do GD, excrevi um programa em Perl para gerar uma imagem com os valores das funções-base para diferentes resoluções (potências de dois).

A imagem abaixo vai de 20 a 210. Cada valor tem 100 linhas de altura e 2n divisões. Isto é, a imagem começa com 1 valor, depois 2, depois 4, etc. Deixei linhas pretas para demarcar os valores (cada um ocupa um retângulo de altura 100 e largua 1024/2n.

O valor de cada célula é e-i2pik/N. O componente vermelho é abs(re)*255, ou seja, a parte inteira. O componente verde é a parte imaginária e o azul é zero.



Já dá para enxergar por onde otimizar o DFT.

Se adiciono um componente azul para valores negativos da parte real, terminho com isto:


Se faço o mesmo para a parte imaginária, tenho isto:


Já que não tenho 4 componentes de cor, vario a intensidade do azul conforme as partes real e imaginária são postivas ou negativas.


Juntando essas ideias, dá para imaginar como atacar o problema.



sexta-feira, 8 de março de 2019

Internet com Horário Comercial

Uma aplicação sensível precisa estar disponível na Internet. O administrador, preocupado sempre com a segurança, decide que o melhor é limitar o acesso ao horário comercial. Entretanto, supõe que quem estiver dentro do prédio fora do horário comercial seja de confiança.

A solução é usar o mod_rewrite e aprender a usar o [OR].


  #Disponível externamente somente das 8h às 18h, de segunda a sexta.
  RewriteCond %{TIME_HOUR} ^(00|01|02|03|04|05|06|07|18|19|20|21|22|23)$ [OR]
  RewriteCond %{TIME_WDAY} ^(0|7)$
  RewriteCond %{REMOTE_ADDR} !^192\.168.*$
  RewriteRule ^.*$ - [F,L]

Entre 8h e 18h e aos sábados e aos domingos, o acesso é bloqueado, exceto se o IP iniciar com 192.168.

Por omissão, as regras são analisadas com AND. O que não está claro é como agrupar quando há ORs também.

O código indica que o OR tem precedência. Então, a solução acima interpreta-se como (A OR B) AND C.


quarta-feira, 20 de fevereiro de 2019

Medição de Poluição em Porto Alegre

A prefeitura de Porto Alegre não mede a poluição do ar desde 2010 e tenho percebido alguns estabelecimentos comerciais usando geradores a diesel. Minha conta de luz subiu, nos últimos dois anos, de R$0,59/KWh a R$0,84/KWh. São 42% de aumento e talvez aí esteja o incentivo necessário para o aparecimento dos geradores. Tampouco percebo fiscalização da poluição dos caminhões e dos ônibus. É possível atravessar a cidade deixando um rastro de fumaça negra sem ser interpelado pela autoridade de trânsito.

Por isso, resolvi fazer um pequeno experimento. Comprei um medidor de partículas, o SDS011. Ele mede apenas partículas de 10 micrômetros e de 2,5 micrômetros. O índice de qualidade do ar (AQI) inclui também gases.

Esse pequeno sensor comunica-se via uma porta serial e o pacote inclui também um adaptador USB e o respectivo cabo. Entretanto, nenhum software é oferecido. Felizmente, o protocolo é simples e envolve apenas enviar uma mensagem de 19bytes (a maior parte é de zeros) e receber uma resposta de 12 bytes). O manual descreve todas as interações.

O equipamento tem uma vida útil de 8 mil horas (um pouco menos de um ano de uso contínuo) e pode fazer medições continuamente, mas, neste caso, eu o coloco em estado de hibernação e o acordo para fazer a medição. Assim, ele irá durar vários anos. Entretanto, é preciso esperar 30s depois de acordá-lo para fazer uma medição.

Escrevi um pequeno programa para fazer a leitura uma vez por hora e deixei-o rodando durante uma semana conectado a um Raspberry Pi 3 B.

Alguns poréns devem ser apontados: o aparelho ficou o tempo todo dentro de casa e bem acima do nível da rua na zona norte de Porto Alegre (que, apesar de ser poluída, tem bastante vento).

Em geral, os resultados foram bons (poucas medições passaram de 10μm/m3, sendo 50μm/m3 o limiar do ar bom). Entretanto, houve um pico de 200μm/m3 de PM10 e 49,9μm/m3 de PM2,5. Essa medição já cai na categoria Inadequado. Talvez algum caminhão tenha passado deixando seu rastro.



Se é que posso tirar alguma conclusão deste meu pequeno experimento, é a de que o ar dentro de minha casa está bom. Um estudo mais abrangente e feito por alguém mais capacitado encontrou que o ar de Porto Alegre não é tão bom assim.

Os próximos passos serão:

  • Medir em outras regiões (o centro e a região sul);
  • Medir ao nível da rua;
  • Medir durante um ano inteiro.



quarta-feira, 23 de janeiro de 2019

Como apagar todos os arquivos, exceto os n mais recentes

Muitas vezes apaguei arquivos antigos com a opção mtime do find, mas agora enfrentei um caso um pouco diferente. Eu precisava deixar 5 cópias de backup numa pasta.

O primeiro passo é enumerar o que é preciso apagar:

ls -1t | tail -n +5
ls -1tr | head -n -5

A opção r do ls inverte a lista e, consequentemente, o tail precisa ser trocado para head.

Essa combinação imprime os arquivos por ordem crescente de data e remove os 5 últimos (os 5 mais recentes). Depois, é preciso escolher a forma de processar a lista.

Uma opção óbvia é o xargs:

ls -1t | tail -n +5 | xargs -d '\n' rm -f --
ls -1tr | head -n -5 | xargs -d '\n' rm -f --

Mas o aninhamento de expressões do shell pode ajudar bastante:

rm -f $(ls -1t | tail -n +5)
rm -f $(ls -1t | head -n -5)

Se for preciso executar o comando numa pasta diferente da atual, basta incluir o caminho no ls:

ls -1dt /var/log/* | tail -n +5

A opção -d evita que o ls tente exibir o conteúdo de subdiretórios; apenas o nome do subdiretório é incluído.