Desempenho de Testes e Modelos

 
 
  A avaliação do valor de uma estimativa qualquer depende de uma verificação da capacidade dessa avaliação de se direcionar especificamente ao objetivo desejado (Acurácia) e de apresentar uma margem de erro pequena (Precisão). Isso pode ser feito no contexto do resultado de um teste para se detectar a existência ou não de uma dada doença, sendo esse o caso mais comum na Medicina, mas também pode ser realizado em termos de uma previsão realizada por um modelo acerca da ocorrência ou não de um dado evento.

Estatisticamente falando, a avaliação da eficácia de um teste ou mesmo de um modelo é realizado através da análise da Tabela 2x2 (lê-se "tabela dois-por-dois"), uma técnica onde uma dada amostra é dividida em quatro grupos segundo seus estados de acometimento ou não de uma determinada doença e de apresentarem resultado positivo ou negativo no exame. Com isso, podem ser calculadas taxas de erros ou acertos que estimam as probabilidades indicativas da acurácia e da precisão do teste.

Tradicionalmente, a Tabela 2x2 tem um formato onde as duas colunas apresentam os dados referentes aos pacientes acometidos ou não de uma dada condição clínica e as duas linhas contém os dados referentes aos pacientes que tiveram resultado positivo ou negativo num teste ou exame que se esteja estudando. Trata-se do esquema a seguir:

Neste caso, a indica a quantidade dos que apresentaram a condição a se detectada e cujos resultados no teste foram, de fato, positivos. Já b é o total daqueles que, apesar de não apresentarem a condição, tiveram testes positivos. O valor c indica todos os que, mesmo apresentando a condição, tiveram resultados negativos no teste. Finalmente, d é o número dos que não apresentaram a condição e cujos resultados no teste foram, efetivamente, negativos. Em se tratando de modelos matemáticos, basta se substituir na tabela acima a palavra "Teste" por "Previsão" e a palavra "Doença" por "Ocorrência".

Diversos construtos importantes são derivados da Tabela 2x2, havendo tanto aqueles referentes ao status da doença quanto aqueles que se referem aos resultados no teste. Os principais são:

  • Sensibilidade: É a fração dos pacientes doentes (ocorrências de evento) que o teste (modelo) é capaz de detectar. Matematicamente, a/(a+c).
  • Especificidade (ou Taxa de Verdadeiro Negativo): É a proporção de pacientes não-doentes (não-ocorrências de evento) que o teste (modelo) é capaz de detectar. Matematicamente, d/(b+d).
  • Valor Preditivo Positivo: É a fração dos pacientes com teste positivo que efetivamente tem a doença, ou então, a fração das previsões de ocorrência que realmente se concretizam. Matematicamente, a/(a+b).
  • Valor Preditivo Negativo: É a fração dos pacientes com teste negativo que efetivamente não tem a doença, ou então, a fração das previsões de não-ocorrência que realmente se concretizam. Matematicamente, d/(c+d).

Naturalmente, os valores específicos obtidos para os indicadores acima numa determinada situação de pesquisa podem surgir aleatoriamente, por pura coincidência, sendo necessário aplicar um teste estatístico, mais comumente o Teste Chi-Quadrado, aceitando os resultados da análise quando a probabilidade do acaso for menor ou igual a 5%.