A UTILIZAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS COMO FERRAMENTA DE OTIMIZAÇÃO DA CLASSIFICAÇÃO NÃO-SUPERVISIONADA
Autores
1Carneiro, A.; 2Cordeiro, T.; 3Narvaes, I.
1INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS Email: arianferreira123@live.com
2INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS Email: tassiofc@hotmail.com
3INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS Email: igor.narvaes@inpe.br
Resumo
No âmbito das Ciências Cartográficas é comum a utilização de técnicas de mapeamento, cada vez mais automatizadas, a fim de propiciar produtos com maior precisão. Nesse contexto, a classificação automática de imagens é a forma em que o computador pode, de forma supervisionada ou não, mapear as feições existentes em uma determinada cena com base em diversos parâmetros. Para Freitas e Pancher (2011), o processo de classificação é baseado na capacidade do computador de extrair informações para reconhecer padrões, presentes em imagens, utilizados para mapear áreas da superfície terrestre. Apesar da existência de diversos processos de classificação, as formas mais difundidas entre os usuários de sensoriamento remoto e pelos softwares comerciais de processamento de imagens estão divididas entre os métodos supervisionados e não-supervisionados. (MENESES E ALMEIDA, 2012). Para a classificação supervisionada é necessário que haja conhecimentos prévios das classes dos alvos. O algoritmo necessita ser treinado para poder distinguir as classes uma das outras. Neste método é necessário colher amostras das classes que se deseja obter a partir do processamento. Há vários métodos para classificação supervisionada como paralelepípedo, distância mínima, distância de Mahalanobis e máxima verossimilhança. (MENESES E ALMEIDA, 2012). As técnicas de classificação não-supervisionada, baseiam-se no princípio de que o algoritmo computacional é capaz de identificar por si só as classes dentro de um conjunto de dados. Esse tipo de classificação é frequentemente realizado através de métodos de agrupamentos (clustering). No entanto, essas técnicas possuem limitações. Por serem utilizados métodos de agrupamentos particionais, as funções objetivo usadas por tais métodos partem do pressuposto de que o número de agrupamentos ou classes é conhecido a priori. Sendo assim, no caso de ser inserido um valor não correspondente ao número real de classes, o método irá impor o valor escolhido, para o agrupamento de dados. (GONÇALVES et al., 2008). A maioria dos programas de geoprocessamento e de sensoriamento remoto possuem os métodos não-supervisionados K-médias e ISODATA. (GONÇALVES et al., 2008). O método clustering denominado de ISODATA usa a distância espectral num processo feito em três etapas: 1 – classifica os pixels de forma iterativa; 2 – redefine os critérios para cada classe; 3 – reclassifica a imagem até os padrões de distância espectral dos dados apareçam. Este fundamenta-se no princípio em que todos os agrupamentos formados na imagem devem ser compactos, com todos os pixels agrupados em volta da média. As condições para a divisão e fusão de agrupamentos giram em torno do desvio padrão da resposta em relação à média e em relação à distância mínima que existe entre os centros dos agrupamentos. (MENESES E ALMEIDA, 2012). O método de classificação K-médias se diferencia do classificador ISODATA no quesito de assumir um número de classes a priori. Após fixar o número de classes, o processo ocorre com o objetivo de minimizar a variabilidade interna do agrupamento dos pixels. Essa variabilidade pode ser dimensionada através da soma das distâncias ao quadrado entre cada pixel e o centro ao qual é alocado. A partir dessa condição a divisão e fusão de clusters não ocorrem. (MENESES E ALMEIDA, 2012). A análise de componentes principais é uma técnica estatística que busca tornar um conjunto de imagens, linearmente não correlacionado. O tamanho do conjunto de imagens de entrada é o mesmo tamanho do conjunto de saída, sendo que retém em ordem de estimação a maior quantidade de informações possível com o mínimo de perda. (VARELLA, 2008). Sendo assim esta técnica deposita em ordem de componentes principais as informações, portanto a chamada primeira componente principal ou (CP1) contém as informações espectrais mais significantes e comuns entres as imagens de entrada. A segunda, os dados um pouco menos significativos e, assim, a última componente apresenta as informações menos significativas para o conjunto de dados utilizados. (CROSTA, 1992). O trabalho foi realizado a partir de um recorte de uma cena Landsat-8 (Sensor: OLI; Órbita/Ponto: 227/062; Data: 30/10/2014) que abrange os municípios de Belterra e Mojuí dos Campos, localizados no Estado do Pará. A cena foi disponibilizada, de forma gratuita, pelo sítio da USGS – United States Geological Survey – pela plataforma EarthExplorer, que possibilita aos usuários o download de imagens já corrigidas atmosfericamente através do método ToA (reflectância no topo da atmosfera), disponível em <https://earthexplorer.usgs.gov/>. Com posse da imagem, o próximo passo realizado foi o recorte da área de interesse das bandas 4,5 e 6 da cena. Em seguida, após o empilhamento das bandas, realizou-se a aplicação da técnica de Análise de Componentes Principais. A partir do resultado da ACP e da composição falsa-cor das bandas originais, as imagens passaram por classificações, ISODATA e K-médias, a fim de comparar a forma de como essas classificações se deram em ambas as imagens. Os aspectos estudados foram: Forma, Área e Sensibilidade ao agrupamento de classes. Para tais análises, foram gerados um conjunto de 10 pontos aleatórios para a vetorização e classificação manual. Com o intuito de comparar os resultados nos aspectos supracitados a fim de avaliar a classificação gerada automaticamente com base na classificação de referência (manual). Através dos possíveis resultados oriundos do cruzamento das informações das classes manuais com as geradas de forma automática, espera-se entender se houve uma otimização ou depreciação do processo de classificação. A forma dos resultados serem avaliados será a de comparar a classificação automática da composição falsa-cor original (sem a aplicação da ACP) com a classificação manual e, da composição formada pelo resultado das componentes principais dessas bandas (4,5 e 6) com a classificação manual. Motivo pelo o qual o trabalho ainda está em desenvolvimento.
Keywords
Sensoriamento Remoto; Classificação; Principais Componentes