• Tomaz Ponce Dentinho

Correlação espacial do COVID-19 em concelhos de Portugal Continental. (Situação em 16/11/2020)

Cassio Rolim ( cassio.rolim@gmail.com )


O exercício aqui realizado utiliza como indicador a taxa de incidência da Covid-19 por 100 mil habitantes. O fato do indicador ser ponderado pela população, evitando a distorção causada pelas grandes concentrações populacionais, possibilita dar um passo além e utilizar instrumentos da econometria espacial que permitem descobrir grupos de municípios

(concelhos) com valores semelhantes. A visualização desses grupos em um mapa possibilita a perceção de áreas críticas e com potencial de expansão do vírus diferenciado no território português. Isso poderá auxiliar as opções mais específicas da política de combate ao vírus.



Procurou-se apresentar um texto de fácil leitura e compreensão, para isso os detalhes técnicos foram concentrados na Nota Técnica. A fórmula de cálculo para o indicador considerado, Taxa de Incidência por cem mil habitantes no município i durante o período considerado, é apresentada abaixo:

A figura 1 mostra a taxa de incidência da Covid-19 por 100 mil habitantes em Portugal no período compreendido entre 28 de outubro e 10 de novembro de 2020 (por simplicidade doravante será referido como incidência no período). Sendo incidência, refere-se apenas aos novos casos ocorridos nesse período (Gordis, 2015). Os grupos foram construídos a partir do algoritmo Natural Breaks utilizado pelo software Geoda. Esse algoritmo divide os grupos de forma a manter o maior grau de similaridade interna entre eles. Note-se que as maiores taxas de incidência ocorreram no norte do país e as menores no Sul.

A figura 2 trabalha com as mesmas informações básicas, mas é construída de forma diferente. Considera-se o número de desvios-padrão em relação à média. O valor médio da taxa de incidência foi 478,13 e o desvio-padrão, 490,441. Note-se que as duas primeiras classes não apresentam ocorrências. A classe com até um desvio-padrão contém 189 concelhos; aquela com dois desvios padrão, agrupa 61 concelhos; três desvios-padrão, 16 concelhos e acima disso, 12 concelhos. Tanto a figura 1 como a figura 2, evidenciam que a maior incidência está no norte do país, porém concentrando-se na sua porção oeste. A segunda área de valores elevados abrange parte do Norte e parte do Centro, porém na sua porção leste.


A Figura 3 mostra os grupos de municípios de Portugal continental segundo a incidência no período da Covid-19. Esses grupos foram obtidos através da aplicação de os indicadores de autocorrelação espacial local (LISA). Eles são uma decomposição ao nível local do conhecido I de Moran, indicador geral de autocorrelação espacial em um conjunto de unidades territoriais. Esses indicadores mostram como a variável taxa de incidência no município i varia com a variação dessa mesma variável, taxa de incidência, nos municípios vizinhos. Apenas aparecem os grupos em que a autocorrelação espacial é estatisticamente significante (Vide a Nota Técnica). Note-se, uma vez mais, que os valores elevados não se referem a números absolutos, mas sim ao número de novos contaminados em relação à população do município.

As áreas em vermelho são os grupos de municípios em que a incidência é elevada (Alto-Alto), tanto no município i como nos seus vizinhos. As áreas em azul escuro representam os grupos de municípios em que esse fenômeno é reduzido (Baixo-Baixo). As áreas em cinza claro, não significativas, são aquelas em que o valor da variável não difere, estatisticamente, da média do conjunto de municípios do país. As áreas em azul claro (Baixo-Alto) e as em rosa (Alto-Baixo), indicam pontos extremos (outliers) em relação aos seus vizinhos. As primeiras indicam agrupamentos em que um município tem incidência baixa e seus vizinhos, incidência alta; nas segundas ocorre o inverso, um município com incidência alta e vizinhos com incidência baixa. Note-se que apenas são representados os municípios centrais dos agrupamentos (core), ainda que o agrupamento (cluster) seja formado pelo município i e seus vizinhos. Isso pode levar a situações curiosas. O Porto e Matosinhos, embora sejam municípios com altas taxas de incidência, não são considerados cores. Isso porque eles fazem parte de clusters que têm municípios com taxas ainda mais elevadas, sendo portanto, o core do cluster.

Pode-se perceber claramente na figura 3 a existência de um grande grupo de municípios com altas taxas de incidência na região Norte do país. Da mesma forma, existe um grande grupo no sul, englobando o Algarve e parte do Alentejo, em que a incidência é baixa. Este tipo de agrupamento também está presente em parte da região Centro. Enquanto as figuras 1 e 2 apenas mapeiam as informações, a figura 3, sendo mais analítica por utilizar instrumentos da econometria espacial, torna a informação mais precisa.


Uma nota importante é que as observações sobre alta/baixa incidência referem-se aos dados dos municípios (concelhos) portugueses. No entanto, com todas as ressalvas necessárias à comparação entre taxas de incidência (Rolim, 2020), os valores observados em alguns municípios são muito elevados qualquer que seja o parâmetro considerado. Tenha-se em conta, por exemplo, os valores verificados em período equivalente para alguns países da Europa. Todos os municípios da tabela 1, constantes do grupo HH da figura 3, tem taxas de incidência no período superiores à da Europa como um todo.

As implicações para a política pública decorrentes deste exercício são óbvias: concentração de esforços nos municípios do cluster HH (Alto-Alto) no Norte e especial cuidado nos clusters HL (Alto-Baixo). Estes últimos são aqueles que potencialmente poderão ser novos pontos de elevadas taxas de incidência.


Como última consideração, este exercício só foi possível com a divulgação das informações por concelhos. No entanto essa divulgação é tardia e pouco frequente. Em um quadro de aceleração do número de novos casos ela é insuficiente para a tomada de decisão política. Em outros países a divulgação de dados ao nível municipal é diária. Até mesmo uma divulgação com base na semana epidemiológica poderia trazer maior eficácia. Aparentemente os dados ao nível de municípios estão na base das decisões políticas do Governo, o que significa a sua existência. No entanto, ao não os divulgar, livre e atempadamente, dificultam a atividade de centenas de pesquisadores em todo o país que poderiam estar produzindo conhecimento adequado e auxiliando o combate à pandemia.

Nota Técnica.

A distribuição de informações em um mapa pode ser analisada visualmente ou analiticamente. A grande diferença entre a análise visual e a analítica é que os resultados desta última podem ter a sua significância estatística testada. Um dos objetivos dessas análises – analíticas – é caracterizar os fenômenos de dependência (autocorrelação) e heterogeneidade espacial. O objetivo é ver se os fenômenos ocorrem aleatoriamente no espaço ou se há uma correlação espacial na sua ocorrência. Um dos instrumentos mais utilizado para a autocorrelação espacial é a estatística I de Moran. Por sua vez, a heterogeneidade espacial pode ser vista com o uso da LISA ( Local indicators of spatial association), que é uma decomposição local do I de Moran.

O índice de Moran mede como a variável z no município i varia com a variação dessa mesma variável z nos municípios vizinhos. Em outras palavras, é um produto cruzado entre uma variável e a sua defasagem espacial (spatial lag), expressas de maneira centrada (desvio em relação à média). No município i, a variável zi = (xi – 𝑥̅ ) em que 𝑥̅ é a média da variável x. Para calculá-lo é necessário, previamente, definir uma matriz de pesos espaciais. O tipo da matriz de pesos definida é essencial para os resultados. (Anselin, 2005)

Uma vez definida a estrutura de vizinhanças com a matriz de pesos espaciais W, a variável de defasagem espacial é a soma ponderada dos valores observados nas localidades vizinhas. Neste caso está sendo usada, para os 278 municípios do Portugal Continental, uma matriz de vizinhança tipo rainha.2 Em média cada município tem 5,3 vizinhos.

No caso de uma matriz de pesos espaciais normalizada, o intervalo de variação de I será:

-1 (dispersão perfeita) ≤ I ≤ 1 (correlação perfeita).

O valor zero indica padrão espacial aleatório; valores positivos indicarão uma correlação positiva com os vizinhos e valores negativos, uma correlação negativa (inversa)3. Valores positivos de I indicam que valores semelhantes da variável aparecem próximos no espaço formando clusters; valores negativos de I, indicam que os valores entre os vizinhos são diferentes, isto é, os valores semelhantes da variável estão dispersos no espaço; ausência de autocorrelação (valores nulos) significam aleatoriedade no padrão espacial de distribuição daquela variável.

A significância estatística pode ser obtida tanto por uma aproximação à curva normal, uma vez que I tem uma distribuição assintoticamente normal, como por um processo aleatório. Este último, mais comum nos exercícios empíricos, baseia-se em permutações aleatórias.(Anselin, 2014)

A figura 5 apresenta o diagrama de dispersão I de Moran. Ele indica um alto grau de correlação espacial para o valor do indicador entre os municípios considerados.


Por sua vez, os indicadores de autocorrelação espacial local irão permitir a decomposição dos indicadores globais (que consideram todas as observações). Anselin (Anselin, 1995) apresenta o LISA para o I de Moran como:

O resultado dos cálculos do indicador local de Moran (LISA) é apresentado em um mapa de clusters: HH (valores altos no centro e na vizinhança); LL (valores baixos no centro e na vizinhança); HL (valor alto no centro e baixo na vizinhança); LH (valor baixo no centro e alto na vizinhança). Apenas os valores com significância estatística são considerados. O mapa também apresenta localidades consideradas não significantes que, geralmente, tendem a ser a maioria. A interpretação para essas localidades é que a variável em análise não é estatisticamente diferente da média nos outros municípios. (Almeida, 2012, p. 129)

A matriz de pesos espaciais utilizada para a construção da figura 3 é uma matriz de contiguidade tipo rainha. É o tipo mais encontrado na literatura. Na figura 6 apresenta-se os resultados para o mesmo indicador porém utilizando uma matriz diferente. Também é uma matriz rainha porém com distância topológica 2. A diferença é que nesta, a vizinhança, além dos vizinhos imediatos, também leva em conta os vizinhos um pouco mais distantes. Exemplificando, um vizinho imediato do Porto seria o município de Vila Nova de Gaia (distância topológica 1); para atingir o vizinho seguinte, Santa Maria da Feira (distância topológica 2 ), é necessário atravessar o território de Vila Nova de Gaia. No caso da distância topológica 1, cada município apresentou em média 5,3 vizinhos (mínimo de 1 e máximo de 10). Para a distância topológica 2, cada município apresentou em média 11,4 vizinhos (mínimo de 2 e máximo de 22).

O que se observa neste exercício é que qualquer que seja o tipo de matriz de pesos espaciais considerada, o grupo de municípios com maior taxa de incidência da Covid-19, detetado na região Norte, e os grupos com menor incidência, detetados na região Centro e no sul do país, tendem a ser consistentes. A matriz com a distância topológica 2 os torna mais compactos.

Referências.

Almeida, E. (2012). Econometria Espacial Aplicada (1a). Alínea.

Anselin, L. (1995). Local Indicators of Spatial Association-LISA. Geographical Analysis, 27(2), 93–115.

Anselin, L. (2005). Exploring Spatial Data with GeoDaTM : A Workbook. (Revised Version, March 6, 2005). Center for Spatially Integrated Social Science, University of Illinois.

Anselin, L. (2014). Geoda Workbook 1.10. Center for Spatial Data Science - University of Chicago. https://geodacenter.github.io/documentation.html

Gordis, L. (2015). Epidemiología (5o ed). Elsevier.

Rolim, C. “Razão, proporção, taxa, coeficiente. É tudo igual?”. Nota Técnica Nesde/UFPR 39/2020. Curitiba: UFPR e SESA, 2020. Doi 10.17605/OSF.IO/YTU3C.

65 visualizações
acda_cubo.png

Associação para a Ciência e Desenvolvimento dos Açores
Canada de Belém

TERINOV - Parque de Ciência e Tecnologia da Ilha Terceira - Sala B4

9700-702 Terra Chã, Angra do Heroísmo

NEWSLETTER

  • White Facebook Icon
  • White LinkedIn Icon
  • White Twitter Icon

© Associação para a Ciência e Desenvolvimento dos Açores