• Félix Rodrigues

Critério único de comparação da dispersão de SARS-CoV-2 em Portugal: Um análise criteriosa

Pedro de Sousa Rodrigues – a partir de publicação de 1 de Setembro

Biólogo com pós-graduação em Estatística

Foi Professor Assistente de Métodos Quantitativos


Resumo


Segue-se, neste primeiro artigo a discussão dos Casos reportados por 100.000 habitantes como critério único de comparação da dispersão do COVID. No segundo artigo irei desenvolver a apresentação de um índice semanal da taxa de mortalidade.


No Mundo de Incerteza, não existem seguramente Critérios e Modelos perfeitos. Mas, existem seguramente critérios e Modelos que nos permitem uma maior aproximação ao conhecimento do fenómeno que queremos compreender. E que se revelam mais fiáveis e mais capazes de nos aproximar efetivamente da realidade. Que resistem à testagem.

Defendo aqui que a apresentação dos casos positivos detetados e reportados por 100.000 habitantes, como critério único comparativo capaz de permitir estabelecer o estado da dispersão do COVID19 em distintos Países Europeus pode constituir, em certas circunstâncias, não um critério objetivo, mas um critério objetivamente duvidoso. Sendo que na realidade, por vezes, a própria ideia de comparação torna-se desde logo questionável.

O que se devia ter tornado evidente quando não existiu sequer o estabelecimento de estratégias comuns ao nível da testagem e da realização do decisivo “contact-tracing” (contato de pessoas que estiveram próximas de infetados e desde logo do seu isolamento imediato).

Utilizo os dados conjuntos de Portugal e de Inglaterra neste primeiro Artigo porque considero que eles estabelecem um caso paradigmático do que aqui se discute.


Amostras adequadas e representativas


Comecemos com duas curiosidades históricas que parecendo meras anedotas, deixam em evidência o que é pedra basilar da Estatística: se a amostra recolhida é adequada para o que estamos a pensar entender.

Informa-nos, a este propósito, Dinis Pestano e Sílvio Velosa (Introdução à Probabilidade e Estatística) que alguém terá dito que R.A. Fischer teria na sua secretária o seguinte aviso:

“Quando consultam um estatístico pedindo a análise de dados recolhidos sem o seu aconselhamento prévio, pretendem um diagnóstico. Mas, em geral só é possível fazer uma Autópsia.”


Um outro exemplo histórico coloca a tónica em como uma amostra não representativa da População tem fracos poderes inferenciais. Quando tem alguns.

O exemplo aparece descrito por Harvey Motulski em “Intuitive Biostatistics”

Um dos maiores fiascos do chamado “pooling”, foi realizado anteriormente à eleição de Roosevelt. A Estatística Moderna então muito jovem, levou a que uns entusiastas pela amostragem resolvessem encontrar os sujeitos para as suas amostras eleitorais Norte-Americanas com base em listas telefónicas e registos automóveis.

Ocorre que em 1936, os votantes Republicanos tinham uma muita mais elevada probabilidade de ter telefone e carro que os votantes Democratas. E, portanto, a amostra era acima de tudo constituída por Republicanos. Como consequência o resultado da sondagem indicava que os candidato Republicano iria ganhar confortavelmente. Foi na realidade o oposto que ocorreu.”


Ora numa doença como o COVID em que existe uma quantidade significativa de assintomáticos (que a meu ver é plausivelmente em maior percentagem em Populações mais jovens), a forma de descortinar a qualidade informativa dos casos reportados não é seguramente de menor importância.


Gráfico e busca de interpretação


Ao olhar para o gráfico duas respostas podem surgir de imediato:


Ele é a prova de que em Inglaterra a taxa de mortalidade foi muito maior. Mas, que a dispersão do vírus em Portugal e seguramente o “positivity rate” foi muito mais elevado.


O gráfico levanta uma interrogação imediata: Porque razão devemos aceitar de animo leve que menos casos em Inglaterra podem dar lugar a mais mortes? Serão o número de casos reportados igualmente representativos do número real (desconhecido) de casos em ambos os Países? Com estas questões estamos aqui a seguir na realidade um princípio fundamental da Análise de dados. E a seguir o conselho de John Tukey que anunciou que o trabalho de analista é um trabalho de detetive. E que só assim podemos ter acesso a uma análise com conclusões mais robustas. Vamos aqui procurar seguir o conselho de Tukey. Desde logo começando por revisitar os dados.


Dados primeiros


Até 4 de Julho de 2020 (dados de sites Oficiais Portugueses) Portugal tinha anunciado 1605 mortes associadas ao COVID. Assumindo uma População de 10.000.000 habitantes, isso significava aproximadamente 16 mortes por 100.000 habitantes.


Nessa mesma data (também por dados de sites Oficiais) Inglaterra (England) apresentava 36.000 mortes desde o início da pandemia associados ao COVID. Assumindo uma População de 57.000.000 habitantes isso significava aproximadamente 63 mortes por 100.000 habitantes.


Pequenas contas de mercearia dizem-nos que 63/16 = 3.94. Ou seja, Inglaterra apresentava aproximadamente 4 vezes mais mortes, per capita, do que Portugal até 4 de Julho. E desde o início da pandemia.


Começamos por referir que se o número de mortes até 4 de Julho não é completo. Porque ainda se espera que mais mortes ocorram com base nos casos até aí existentes. A ideia de que por isso o número de mortes é uma métrica sem valor informativo para responder às nossas dúvidas é simplesmente falso. Desde logo porque depois dessa data podemos seguramente realizar os necessários acertos. Podemos tentar verificar quantas mais mortes terão ocorrido após 4 de Julho, com base em casos detetados anteriormente a essa data. Mas, mesmo sem ter este dado disponível, o que podemos seguramente assegurar, é que nas semanas seguintes a 4 de Julho e até 9 de Agosto, o Reino Unido apresentava por dia (média semanal) mais mortes por COVID do que Portugal apresentava por semana. E como Inglaterra contribuía com uma larga proporção para o número de mortes anunciadas no Reino Unido, a diferença de 3.94 vezes acima detetada pode bem ser uma aproximação por defeito e não por excesso.


O senso comum ensina-nos a considerar perante tais factos que o contágio da doença em Inglaterra tinha sido mais alargado. E que o número real de pessoas infetadas em Inglaterra, per capita, era obviamente maior.


Ocorre que, por vezes, uma análise mais global dos dados pode revelar como o senso comum por vezes pode estar incompleto ou falhar o ponto. Por exemplo, descobrindo que uma certa População apresenta maiores fragilidades do que outra em relação a um determinado vírus. E que nessa situação menos casos podem originar mais fatalidades. E quem tem senso comum pode seguramente continuar a compreender este argumento.


A questão é que não vejo razão para que Portugal com uma População mais envelhecida (3.1%, per capita, a mais de idosos com ou acima dos 70 anos de idade e 2.5% de pessoas a mais entre os 55 e os 69 anos). Sendo que é nestas faixas etárias que a taxa de hospitalizações e de mortalidade por COVID é maior. Com um número de crianças e de adolescentes dos 0 aos 19 anos 5% menor (sendo que estes têm baixíssimas taxas de mortalidade para a COVID). E também com problemas de obesidade sérios incluindo ao nível infantil (embora menos obesidade dita mórbida do que Inglaterra). Não vejo razão dizia para que o número de mortes per capita em Inglaterra fosse aproximadamente 4 vezes maior do que o de Portugal, sem de facto sugerir de imediato a existência de mais casos em Inglaterra.

(Dados demográficos recolhidos em www.populationpyramid.net)


Disparidades


A 4 de Julho os dados reportavam em Portugal 47.000 casos (aproximação aos milhares) detetados de COVID. Que representava 470 casos por 100.000 habitantes.

E Inglaterra, na mesma data, 161.000 casos (aproximação aos milhares) que representava 282 casos por 100.000 habitantes.


Ou seja, Portugal apresentava mais 1.6 vezes de casos detetados per capita. O gráfico de cima fica assim revisitado.


O que o gráfico não diz é que estes dados ocorrem depois de Inglaterra ter apostado durante um período na “contaminação de rebanho” e ter confinado mais tarde. Ou seja, confinou após contaminação alargada a toda a População.


Aqui podemos ver a surgir o argumento de que em situações de surtos de grande dimensão (como as que terão ocorrido em Inglaterra) o número percentual de mortes tende a aumentar por razões várias, incluindo falta de acompanhamento hospitalar mais adequado. Um argumento lógico que tem de conter Verdade. Mas, contém toda a Verdade? Na realidade existe desde logo um sério contra-argumento.


É que nesses mesmos momentos de grandes surtos a capacidade de testar, de realizar “contact-tracing” tendeu a ser mais ou muito pobre.

Neste sentido o número de casos reportados está plausivelmente longe (ou muito longe) do número real de casos que realmente ocorreram. Um dado que se torna ainda mais evidente e plausível após um período e “contaminação de rebanho”.


A meu ver é simples: a disparidade de dados apresentada acima constitui um dos avisos sérios de como os casos detetados e reportados podem ser um péssimo critério único de comparação da dispersão de COVID numa população.


E é com a mais elevada probabilidade um dos fatores mais sólidos que explica a disparidade que acima verificámos. Mas, é necessário ainda reforçar a ideia.


Muito bem, podemos agora tentar concluir: mas, a verdade é que essa falta de fiabilidade de dados encontrada no passado por motivos particulares entendíveis, deixou de ocorrer. E por isso esse facto já não é agora de tanto relevo. Os problemas iniciais foram solucionados.

É precisamente isso que pretendo verificar no próximo artigo. Com análise de dados até 9 de Agosto.


Finalmente, para fazer a ligação com o próximo artigo convém dar atenção a alguns dados adicionais finais.


Estimador natural da taxa de mortalidade


O estimador natural da taxa de mortalidade real de uma doença na População (encontrado noutras fontes como “fatality rate”) é dada por:

(Número de morte reportadas/Número de casos detetados) x 100.


Quando se apresenta este estimador encontra-se geralmente a referência que a sua maior fragilidade é o número de casos detetados. Que tendem a ser distintos do número de casos reais.

Sendo que no caso da COVID19 esta maior fragilidade do estimador é seriamente aumentada pela existência de um elevado número de assintomáticos. Que são a fonte de contágio, por excelência. E motivo de toda a preocupação para futuros surtos.

(A discussão do número de mortes será analisada no artigo seguinte).


Um dos resultados imediatos desta fragilidade é que menos casos detetados dá lugar a estimativas mais elevadas da taxa de mortalidade Populacional.


Tenhamos bem presente(!): uma maior taxa de mortalidade estimada na População pode ocorrer não porque essa População tenha algum tipo de inferioridade genética para a doença ou qualquer outra fragilidade demográfica de realce comparativo ou até e ainda por mau acompanhamento hospitalar, mas, por pura deficiência do número de casos detetados.

E isto tende a ser plausivelmente mais possível, em fases moderadas de contágio. Que é o que iremos analisar no próximo artigo.


Notemos agora, no nosso exemplo em estudo, mesmo sabendo que mais mortes ainda irão decorrer dos casos reportados até 4 de Julho mas, entendendo também que mais mortes aumenta a taxa de mortalidade estimada. Temos por defeito:

Em Portugal até 4 de Julho: (1605/47.000) x 100 = 3.6%

Em Inglaterra até 4 de Julho: (36.000/161.000) x 100 = 22.4%.


A estimativa de Portugal a meu ver levanta a suspeita de que os casos detetados podem ainda ter alguma falta de fiabilidade. Mas, uma taxa de mortalidade de 22% está seguramente noutra dimensão. E representa aproximadamente a taxa de mortalidade que se estabelece existir para pessoas idosas também com outras fragilidades (doenças coronárias, diabetes, doenças respiratórias, etc).

Mesmo considerando deficiências acrescidas no acompanhamento Hospitalar por via dum surto de grandes dimensões, este número em Inglaterra é superior ao verificado em Itália (em redor dos 14%) numa situação em que os métodos para lidar com pacientes era de menor qualidade por maior desconhecimento do vírus. Sendo que Itália é a População mais envelhecida da Europa. Sendo que a proximidade entre distintas gerações é tida como maior em Itália o que pode conduzir a um maior grupo de idosos a ser contaminado. Sendo que os Hospitais deixaram de poder responder adequadamente ao influxo dos doentes. Em que muito dos próprios cuidadores e seus auxiliares viriam a sofrer séria contaminação por indevida proteção. E em que seguramente, e também, o número de casos reportados não continha uma boa aproximação do número de casos reais.


Como consequência, dos resultados acima expostos, este estimador natural da taxa de mortalidade é considerado corretamente como podendo ser pouco informativo da real taxa de mortalidade. Precisamente pela possível pouca fiabilidade dos casos detetados. E, no entanto, esses, “mesmos pouco fiáveis casos”, podem constituir um critério de comparação único.


O que fazer então?

É o tema que desenvolvo no próximo artigo.


Conclusão


Então os casos reportados não têm valor algum? Não foi isso que esteve aqui em discussão. Números preocupantes e fiáveis obviamente que permanecem preocupantes.

O que eu referi foi que números não fiáveis têm paupérrimas propriedades Estatísticas. E, pelo menos, sem possíveis e significativos acertos, podem ser números mais enganosos que informativos. E objetivamente duvidosos. E, portanto, procurar métodos, mesmo que experimentais, da qualidade dos casos reportados é crucial.

No caso COVID e em particular sem um bom “contact-tracing” em ação (ou sem testar largas porções da População), o número de casos detetados corre mesmo o sério risco de ser uma má representação do número de casos reais. E, como consequência, um péssimo indicador da dispersão da doença que pode estar a ocorrer.

Refiro agora que o chamado “positivity-rate”(número de casos em cada 100 testes encontrados) pode ter notórias fragilidades. A menos que se teste em elevada escala. Neste caso, assumimos que os testes estão a ser elucidativos. Mas, como o podem estar se o número de casos não for nada elucidativo? Como pode Portugal no mês de Julho continuar a revelar um significativo menor números de mortes per capita e Inglaterra ter um “positivity rate” anunciado na WHO de 0.1% e Portugal de 2%. Ou seja, Inglaterra ter uma previsão de 1 caso em cada 1000 e Portugal 20 casos em cada mil?

Finalmente, assumindo que dois Países estão a reportar idênticos e acertivos números de casos quando um tem um bom “contact-tracing” e outro um deficiente “contact-tracing” indica que no momento o grau de dispersão pode ser idêntico. Mas, o grau de “perigosidade” dos dois Países é distinto. Porque há partida quem tem “contact-tracing” de qualidade está a conseguir isolar possíveis e novos contagiados e até possíveis “contagiadores” assintomáticos. O que é de relevo.


Recordo agora uma frase de Lewontin, para concentrar a energia no que realmente interessa:

“Não somos apenas influenciados e moldados pelo ambiente que encontramos. Nós somos também criadores do ambiente”. O que deve significar neste contexto:

apenas com estratégias comuns de qualidade e para o bem comum podemos derrotar um “inimigo” comum. Com benefícios comuns e alargados. Também económicos.



102 visualizações
acda_cubo.png

Associação para a Ciência e Desenvolvimento dos Açores
Canada de Belém

TERINOV - Parque de Ciência e Tecnologia da Ilha Terceira - Sala B4

9700-702 Terra Chã, Angra do Heroísmo

NEWSLETTER

  • White Facebook Icon
  • White LinkedIn Icon
  • White Twitter Icon

© Associação para a Ciência e Desenvolvimento dos Açores