Mas como saber se análise foi adequada já que tenho uma tabela com os resultados? Uma das formas mais simples é através do comando plot aplicado ao modelo, ou seja, ao resultado da sua análise Este comando permite um diagnóstico da qualidade do nosso modelo, neste caso uma regressão, mas esse pode ser feito em qualquer modelo linear, como a análise de variância, por exemplo:
Para entendermos melhor como interpretar, vamos analisar duas regressões, uma que segue as premissas (ver em um livro de estatística mas, já adiantando algumas: homogeneidade das variâncias do resíduo, normalidade, etc.) e uma outra cujos dados não são adequados para este tipo de modelo. Para facilitar vou usar dados similares aos que usamos para fazer a regressão entre FL e RW.
library(MASS)
attach(crabs)
RW2<-2^RW
minha.regressao1<-lm(FL~RW, data=crabs)
minha.regressao2<-lm(FL~RW2, data=crabs)
Você entendeu o que foi feito na segunda regressão de diferente?
Mas vamos continuar. Agora vamos fazer uma inspeção dos resíduos da análise para ver quanto elas fogem das premissas da regressão, mas também poderia ser da análise de variância.
A primeira linha de comando par(mfrow=c(2,2), vai dividir a sua janela de figuras (os plots) em quatro partes (duas linhas duas colunas, por isso o c(2,2))
A seguir é dado o comando plot no objeto minha.regressao1 e minha.regressao2 - note que é a função plot é aplicada a um objeto que é o resultado de um modelo (no caso a regressão), e não a variáveis como visto antes.
par(mfrow=c(2,2))
plot(minha.regressao1)
plot(minha.regressao2)
Em síntese, o modelo Reg1 é adequado para os dados, a análise de regressão pode ser interpretada, já para Reg2, o modelo de regressão linear utilizado não é adequado para descrever os dados.
Como dito, os mesmos diagnósticos podem ser efetuados apra a Análise de Variância, a diferença é que, ao invés dos dados serem distribuídos ao longo do eixo y (exceto no Q-Q plot), estes estão agrupados nos diferentes níveis das variáveis categóricas. Abaixo veja o mesmo diagnóstico mas com o modelo de anova, a interpretação é a mesma.
minha.anova2<-lm(CW~sp*sex, data=crabs)
par(mfrow=c(2,2))
plot(minha.anova2)
Estes diagnósticos, obtidos através da plotagem dos resíduos dos modelos são inspeções visuais que indicam quão adequada é a análise para os dados fornecidos. Não existe um valor mágico mas sim um gradiente de qualidade. Nos casos onde a análise é inadequada há outras soluções como: (1) transformar os dados antes de realizar a análise, (2) fazer análises que trabalham com outros tipos de distribuição diferentes da normal ou que permitam variâncias muito distintas. Mas isso é assunto para outra aula.