Uma Avaliação de Variantes de Redes Neurais Recorrentes para o Reconhecimento de Tipos Culturas Agrícolas em Imagens Multitemporais de Sensoriamento Remoto.


Autores

1Bermudez, J.; 2Queiroz, R.; 3Happ, P.; 4Costa, G.; 5Sanches, I.; 6Achanccaray, P.; 7Cue, L.

1PUC-RIO Email: bermudez@ele.puc-rio.br
2PUC-RIO Email: raul@ele.puc-rio.br
3PUC-RIO Email: patrick@ele.puc-rio.br
4UERJ Email: gilson.costa@ime.uerj.br
5INPE Email: ieda.sanches@inpe.br
6PUC-RIO Email: pedro9589@ele.puc-rio.br
7PUC-RIO Email: lauracue@ele.puc-rio.br

Resumo

Métodos para mapeamento agrícola são essenciais para a definição de políticas que visam à segurança alimentar. Neste contexto, o monitoramento da fenologia de culturas agrícolas através de sequências multitemporais de imagens de sensoriamento remoto tem adquirido relevância nos últimos anos devida à boa relação custo-benefício em comparação com abordagens alternativas. A disponibilidade crescente de imagens de satélites gratuitas com resoluções espacial e temporal cada vez maiores tem permitido capturar com exatidão a evolução de culturas agrícolas ao longo de seus estádios fenológicos característicos, o que permite estimar a produção agrícola com melhor acurácia. Embora inúmeras abordagens tenham sido propostas para modelar fenologia, destacam-se aquelas baseadas em Campos Aleatórios Espaço-Temporais de Markov e nos Campos Aleatórios Condicionais. Ambas as abordagens exploram tanto o contexto espacial quanto o contexto temporal e permitem alcançar ganhos de acurácia significativos em comparação com métodos convencionais baseados no empilhamento das imagens da sequência (image stacking) seguido de classificação via Máquinas de Suporte Vetorial (SVM), Comitês de Árvores de Decisão (random forest) ou Redes Neurais, entre outros. Em contrapartida o esforço computacional, assim como o número de amostras rotuladas requeridas para o adequado treinamento supervisionado é maior. Também merecem menção embora ainda incipientes, estudos sobre o uso de redes convolucionais profundas para o problema de classificação de culturas. Por outro lado, as Redes Neurais Recorrentes (RNN), em particular as de memória de curto e longo prazo (LSTM) e suas variantes, têm sido usadas com sucesso em problemas de modelagem temporal, e representam o estado da arte em aplicações que incluem reconhecimento de voz e de texto. Não obstante as similaridades com tais aplicações, não encontramos na literatura estudos sobre o potencial de redes recorrentes aplicadas à modelagem da fenologia de culturas agrícolas. Neste contexto, o objetivo do presente trabalho é avaliar diferentes arquiteturas de RNNs, com especial interesse nas LSTM, para o reconhecimento de culturas agrícolas em sequências de imagens de sensoriamento remoto. Segundo o conhecimento dos autores, este é o primeiro trabalho voltado ao uso de RNNs para mapeamento agrícola. Basicamente, as RNNs são redes neurais com realimentação; a saída a cada instante de tempo depende tanto da entrada corrente quanto da informação prévia armazenada na rede, propriedade que permite a modelagem de dados temporais. Embora o interesse pelas RNN tenha crescido somente nos últimos anos, elas foram proposta nos anos 80. O custo computacional associado, assim como as dificuldades (desvanecimento/explosão do gradiente) para o aprendizado de seus parâmetros desencorajaram pesquisas em sobre o tema por longo tempo. Contudo, a disponibilidade de maior poder computacional trazida pelas placas de vídeo (GPUs) e o surgimento de novas arquiteturas como as redes LSTM, que resolvem muitas das dificuldades presentes nas RNNs tradicionais, colocaram as RNNs novamente no centro de muitas pesquisas atuais. Uma rede LSTM apresenta uma estrutura mais flexível do que uma RNN tradicional. O problema do desvanecimento/explosão do gradiente é resolvido numa rede LSTM mediante somas controladas por meio de três portas: porta de esquecimento, porta de entrada e porta de saída. A porta de esquecimento regula quando a informação relativa ao estado anterior é preservada/descartada. A porta de entrada define quando a informação dos dados de entrada é relevante e deve ser considerada. A porta de saída determina qual é o resultado da rede depois de se executarem as anteriores operações. A quantidade de parâmetros da LSTM a serem sintonizados é maior do no caso das RNNs convencionais: cada porta é em realidade uma rede neural. Neste sentido, têm-se proposto variantes que visam reduzir a quantidade de parâmetros, destacando-se entre estas a Porta de Unidade Recorrente (gate recurrent unit - GRU). O presente trabalho apresenta e avalia diferentes modelos de classificação de culturas agrícolas utilizando RNNs. Os modelos são comparados experimentalmente utilizando duas bases de dados. A primeira compreende uma sequência de nove imagens Landsat do município de Ipuã no estado de São Paulo, Brasil capturadas entre agosto 2000 e julho 2011. A referência para cada época foi produzida por interpretação visual realizada por um especialista. A segunda base de dados utilizada no estudo é formada por 14 imagens SAR do satélite Sentinel-1 do município de Campo Verde no estado de Mato Grosso, Brasil, capturadas entre outubro de 2015 e julho de 2016. Neste caso, a referência foi produzida através de visitas de campo complementadas por interpretação visual e utilizando imagens óticas da mesma área do mesmo período. O estudo, embora preliminar, indica o claro potencial das RNNs para mapeamento agrícola e aponta direções promissoras para a melhoria dos modelos testados.

Keywords

Redes Neurais Recorrentes; Fenologia de Culturas; Sequências Multitemporais

ARTIGO COMPLETO

PATROCINADORES

CNPQ ISPRS GRSS

APOIO