UTILIZAÇÃO DE ALGORITMOS DE APRENDIZADO DE MÁQUINA PARA ESTIMATIVAS DE BIOMASSA AÉREA EM FRAGMENTOS DE FLORESTA OMBRÓFILA MISTA NO PARANÁ
Márcio Assis Cordeiro
Defesa Pública: 27 de fevereiro de 2024
Banca Examinadora:
Prof. Dr. Hélio Garcia Leite, UFV, Primeiro Examinador,
Prof. Dr. Lucio de Paula Amaral, UFSM, Segundo Examinador,
Profª. Dra. Andrea Nogueira Dias, UNICENTRO, Terceira Examinadora,
Prof. Dr. Gerson dos Santos Lisboa, UFG, Quarto Examinador,
Dr. Luciano Farinha Watzlawick, UNICENTRO, Orientador e Presidente da Banca Examinadora.
Resumo:
Este estudo teve por objetivo comparar diferentes alternativas para estimar a biomassa aérea seca de 6 (seis) diferentes regiões de Floresta Ombrófila Mista no estado do Paraná. O estudo foi desenvolvido utilizando amostras de biomassa aérea de 382 árvores, coletadas por meio do método destrutivo, distribuídas nas regiões de Araucária (102), Boa Ventura de São Roque (26), Castro (42), Coronel Vivida (17), General Carneiro (172) e Reserva do Iguaçu (23). O número de espécies encontradas foi de 109 com predominância das Euphorbiaceaes (86), Myrtaceaes (54), Lauraceas (29), Aquifoliaceas (26), Primulaceaes (24) e Araucariaceaes (15) entre outras, com destaque para o Pinheiro do Paraná que foi amostrado apenas em General Carneiro. As florestas sofreram ações de manejo em diferentes graus e várias estão em franco processo de regeneração, pois foram isoladas pelos proprietários. Com os dados de biomassa, diâmetros e alturas totais ajustou-se o modelo de Schumacher e Hall (1933) para o banco de dados total e para cada área separadamente, considerando as estruturas de um modelo de efeito fixo e de um modelo misto. Também foram treinadas 100 redes neurais (RNA) do tipo Multilayer Perceptron (Multicamadas), empregando-se os algoritmos Backpropagation e Simulated Annealing para todo o conjunto de dados e por formação florestal (com 70% dos dados), de forma supervisionada. Além disso, foram utilizadas seis configurações de máquina de vetor de suporte (MVS), formadas a partir de duas funções de erro e quatro funções de kernel. As funções de erro otimizadas foram: função do tipo I e do tipo II. Além das abordagens dos modelos de efeito fixo e misto, foi realizado o teste F, que avalia a hipótese de que o modelo reduzido para os grupos é idêntico aos modelos completos para cada área em estudo. Foi utilizado também o algoritmo Random Forest (RF) possuindo o parâmetro fixo de 500 árvores de regressão (Ntree). Os critérios de seleção utilizado em todos os métodos foram a correlação entre a biomassa observada e estimada (ryŷ), a raiz quadrada do erro quadrático médio (RQEM), bias (viés), Média das Diferenças Absolutas (MDA), e entre os modelos fixo e misto, utilizou-se as estatísticas AIC (critério de informação de Akaike) e BIC (critério de informação Bayesiano), também foi analisado graficamente os valores observados e estimados para cada área de estudo, a distribuição de frequência por classe de erro relativo percentual. Após o vi processamento dos dados, verificou-se que as MVS apresentaram melhores resultados para o conjunto total de dados e para as áreas em Araucária e Castro, o modelo de efeito fixo apresentou melhor resultado na área de Boa Ventura de São Roque, já nas áreas de estudo em Coronel Vivida, General Carneiro e Reserva do Iguaçu, as RNA obtiveram melhores desempenhos.