Modelo de machine learning prevê a ocorrência de relâmpagos nos próximos 30 minutos

Relâmpagos são responsáveis por danos socioeconômicos diversos, causando desde interferência eletromagnética a circuitos elétricos, prédios, linhas de transmissão, turbinas de vento e fotovoltaicas, até incêndios e morte de animais e pessoas. Por causa disso, atenção considerável tem sido dada à predição dos eventos que resultam na descarga de relâmpagos. Entretanto, como esse fenômeno envolve interações complexas entre processos atmosféricos, muitas abordagens diferentes para predição têm sido propostas, as mais complexas envolvendo modelos numéricos que incorporam física de eletrificação complexa. Uma parte desses métodos foca na tarefa de fazer predições para o futuro imediato, adicionando aos modelos matemáticos medições de satélite e radar obtidas em tempo real. Com isso, tem sido possível gerar alertas com antecedência de até 1 hora que permite aos responsáveis acionar planos de prevenção para preservar instalações e reduzir riscos à segurança.

Uma equipe de pesquisadores da Escola Politécnica Federal de Lausanne, na Suíça, reconheceu na complexidade do problema e no grande número de parâmetros a possibilidade de aplicar técnicas de machine learning. Eles aproveitaram a proliferação recente de bases de dados geradas em plataformas de monitoramento meteorológico ao redor do mundo para mineirar dados úteis à predição do acontecimento de relâmpagos. Um modelo foi treinado para prever a incidência de relâmpagos em uma região específica dentro do intervalo de 30 minutos, a partir de medidas em tempo real de quatro parâmetros meteorológicos relevantes para a geração de cargas elétricas em tempestades: a pressão e a temperatura atmosférica, a umidade relativa, e a velocidade do vento. Ainda que esses parâmetros não representem necessariamente as condições nas altitudes elevadas, dentro da zona de formação dos relâmpagos, elas são indicadoras de fatores envolvidos nas tempestades, além de serem mensuradas de forma mais confiável e contínua que as condições mais estreitamente relacionadas à formação dos relâmpagos. A utilização dos parâmetros selecionados em uma abordagem de machine learning ainda torna o sistema de predição proposto independente de fontes externas de dados, como as geradas por satélites e radar, e de modelos numéricos pré-definidos.

O modelo desenvolvido pelos pesquisadores usou dados de 12 estações meteorológicas na Suíça, cobrindo o período de 2006 a 2017. Ele foi avaliado na sua capacidade de prever os eventos em três janelas de tempo: 0-10 minutos, 10-20 minutos, e 20-30 minutos no futuro. Os resultados de quatro métricas de desempenho, entre elas a probabilidade de detecção (uma medida de precisão) e a taxa de alarme falso (uma medida de falsos positivos), foram melhores que outros três métodos descritos na literatura, em duas das estações para as quais haviam dados para comparar. A probabilidade de detecção foi maior que 71% (contra 56% do segundo colocado) e a taxa de alarme falso foi menor que 15% (contra 26%) considerando todas as condições. Na média, os resultados para a taxa de alarme falso foram muito melhores que aqueles dos outros métodos, o que revela a robustez do modelo de machine learning, já que os dados usados para treinamento tinham uma proporção muito maior de “não-eventos”, o que pode resultar num número grande de falsos positivos se o método não for adequado para descrever o fenômeno.

Os pesquisadores também avaliaram quais foram as variáveis mais importantes no modelo de predição. Em 7 das 12 estações, a variável que prevaleceu foi a pressão atmosférica; nas outras 5, foi a temperatura atmosférica. Em apenas uma estação, a umidade relativa foi a variável menos importante; em todas as outras, a velocidade do vento teve a menor relevância.

O trabalho desenvolvido, publicado no último dia 8, tem duas principais vantagens em relação aos demais métodos. Primeiro, ele permite previsões e alertas localizados, que se beneficiariam de redes onde usuários poderiam fazer o upload de seus próprios dados por exemplo, sem depender da cobertura de satélites e radares, que além de cara, nem sempre está disponível. Segundo, os dados de entrada do modelo não estão sujeitos aos ciclos típicos de escaneamento e atrasos de processamento, podendo ser usados em tempo real com alta resolução temporal. Mas além disso, ele demonstra a possibilidade de aplicar técnicas de machine learning em um conjunto grande de dados de forma a fazer predições confiáveis, mesmo sem conhecer os detalhes matemáticos dos fenômenos que regem a correlação entre variáveis de entrada e a saída de um sistema complexo.

Seja o primeiro a comentar

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *