Feeds:
Posts
Comentários

Posts Tagged ‘dendrograma’

A construção de dendrogramas por meio da análise de agrupamento é uma forma interessante de se avaliar a similaridade florística e estrutural de comunidades de espécies arbóreas. O agrupamento de locais parecidos entre si tem como objetivo simplificar a complexa organização existente em ecossistemas de florestas tropicais e subtropicais. Essa simplificação é necessária para facilitar a interpretação ecológica destes ambientes. Neste tutorial do R utilizarei como exemplo uma matriz binária (presença e ausência), o índice de Jaccard para o cálculo de uma matriz de dissimilaridade e o método de ligação UPMGA (“Unweighted Pair Group Method with arithmetic”) para a construção do dendrograma.

1 passo: Importar a matriz de presença e ausência ou de abundância

Para exemplificar, disponibilizei no dropbox uma matriz hipotética de presença e ausência, que pode ser importada a partir do seguinte comando:

teste<-read.csv("http://dl.dropbox.com/u/6511995/testeR.csv", header=T, row.names=1, sep=";")

O resultado esperado é uma matriz binária de 5 linhas (locais) por 5 colunas (espécies).

2 passo: Instalar a biblioteca vegan:

install.packages("vegan")

Irá abrir uma caixa de diálogo, solicitando a escolha de um “espelho” para fazer o download. Escolha o mais próximo de você.

3 passo: Carregar a biblioteca vegan:

library(vegan)

4 passo: Calcular a matriz de dissimilaridade por meio do índice de Jaccard

clust_teste<-vegdist (teste, method = "jaccard")

Este índice varia de 0 a 1, sendo que 1 indica locais completamente diferentes entre si, ou seja, sem espécies compartilhadas. O argumento method indica qual índice de dissimilaridade a ser utilizado. O índice de Jaccard foi utilizado neste exemplo pelo fato de utilizarmos uma matriz binária. Para este caso também poderia ser empregado o índice de Sorensen. No caso de matrizes de abundância, poderia ser utilizado o índice de Bray-Curtis.

5 passo: Plotar o dendrograma construído por meio do método de ligação UPGMA

plot(hclust(clust_teste, method="average"), hang=-1)

O método de ligação utilizado é definido pelo argumento method. O resultado obtido deverá ser esse:

Observe que os locais 1 e 4 são os mais semelhantes entre si (0,25), enquanto o local 5 foi o que mais diferiu em relação aos demais.

Para mais informações, recomendo a leitura da seguinte referência: http://cc.oulu.fi/~jarioksa/opetus/metodi/sessio3.pdf

Anúncios

Read Full Post »