Dados do Trabalho
Título
Modelagem de dados georreferenciados por aprendizagem de máquina para predição de áreas com favorabilidade ecológica e socioambiental à ocorrência de febre amarela no Brasil
Introdução
<p>A identificação de áreas favoráveis à ocorrência de febre amarela (FA) é essencial para adoção de ações preventivas e mitigadoras de emergências em Saúde Pública. Contudo, a intrincada dinâmica de transmissão, com fatores bióticos e abióticos, além da extensão territorial e diversidade do Brasil, tornam essa tarefa um enorme desafio. Métodos de aprendizagem de máquina (AM), notáveis por modelar fenômenos complexos a partir de massa de dados, têm sido cada vez mais adotados no estudo da ocorrência de zoonoses</p>
Objetivo (s)
<p>Propor metodologia de modelagem de ocorrência de FA baseada em AM, em particular no algoritmo Support Vector Machine (SVM); predizer regiões favoráveis à ocorrência de FA segundo os modelos resultantes; e fornecer ferramenta e modelos em apoio à tomada de decisão</p>
Material e Métodos
<p>Compilou-se 341 casos georreferenciados de ocorrência de FA no país entre 08/2020 e 03/2024, distribuídos em SC (161), RS (107), GO (22), MG (19), PR (16), DF (10) e SP (6). Para cada ponto, calcularam-se estatísticas descritivas das características ambientais do entorno para três raios de influência, objetivando a análise multiescala: 100 m, 500 m e 1000 m. Os dados ambientais foram: cobertura florestal, altitude, precipitação e temperatura, que após o cômputo das estatísticas resultaram em 423 variáveis. A Análise de Componentes Principais (PCA) foi então aplicada, retendo 90%, 95% e 99% de variância, e treinaram-se diversos modelos SVM (Oneclass) com parâmetros distintos para fins de robustez. No total, 891 modelos foram obtidos (3 raios x 3 PCAs x 99 conjuntos de parâmetros). Destes, 223 alcançaram 90% de acurácia de treinamento e foram aplicados na grade de 1 km sobre o Brasil (~8,5 milhões de pontos) para gerar as predições</p>
Resultados e Conclusão
<p>As predições sobre a grade foram agregadas por região, produzindo índices proporcionais à favorabilidade. Os cinco estados que agregam as condições ecológicas e socioambientais mais favoráveis foram: SC, DF, PR, RS e RO e quando analisados os municípios isoladamente, Salgado Filho-PR, Manfrinópolis-PR, Bom Jesus do Sul-PR, Itatiba do Sul-RS e Severiano de Almeida-RS foram destacados. Neste estudo, apesar do viés amostral com forte influência do sul do país, identificaram-se as regiões com maiores índices de favorabilidade à ocorrência de FA. Estes apoiaram políticas públicas de vigilância da FA e resposta efetivas consolidando o uso de algoritmos de AM como métodos alternativos e complementares para identificação causas de fenômenos complexos e doenças infecciosas</p>
Palavras Chave
Arboviroses; Support Vector Machine; modelos preditivos
Área
Eixo 17 | 1.Vigilância em saúde - Emergências em Saúde Pública
Prêmio Jovem Pesquisador
4.Não desejo concorrer
Autores
Marcia Chame, Douglas Adriano Augusto, Livia Abdalla, Eduardo Krempser, Daniel Garkauskas, Pedro Passos, Alessandro Pecego Romano