Portal de Eventos - UEM, XIII Semana da Estatística da UEM

Tamanho da fonte: 
Um Estudo Sobre Dados Sobredispersos
Clédina R. L. Acorsi, Valentina L. Milani, Angela M. M. Araujo

Última alteração: 2016-10-13

Resumo


O principal objetivo do trabalho é a abordagem da modelagem de dados que apresentam o fenômeno da sobredispersão ou, como também é denominada, variação extra. A sobredispersão caracteriza-se pelo fato da variação observada nos dados modelados apresentar-se rmaior do que a variação prevista pelo modelo proposto para sua análise. É um fenômeno bastante frequente cujas causas basicamente são atribuídas ao uso de funções de ligação inadequadas, omissão de termos ou variáveis importantes, correlação entre as respostas individuais, presença de valores atípicos, número excessivo de zeros ou simplesmente a variação pode ser maior do que o previsto pelo modelo proposto. Quando sua presença é desconsiderada, tem como consequência a produção de erros padrões incorretos e subestimados; testes com resultados equivocados que podem, erroneamente, sugerir significância estatística; alterações na deviance associadas à inclusão de termos que levem a escolhas de modelos complexos e inadequados cujas interpretações provavelmente serão incorretas, com estimativas e predições não precisas que comprometem todo o trabalho do pesquisador.  Serão discutidos modelos com sobredispersão para dados binomiais (taxas ou proporções) por meio da distribuição beta-binomial e da distribuição binomial Inflacionada de Zero.  Para os casos de presença excessiva de zeros, em relação a dados de contagem, será apresentada a opção dos modelos de Poisson Inflacionados de Zeros e os modelos truncados em zero, também conhecidos como modelos de Hurdle. Destaca-se que para as distribuições inflacionadas de zeros, a ocorrência de zeros caracteriza-se em por duas situações: (i) zeros que ocorrem segundo uma distribuição de contagem ou (ii) zeros estruturais.


Palavras-chave


Sobredispersão, distribuição beta-binomial, binomial Inflacionada de Zero, Poisson Inflacionados de Zeros, modelos de Hurdle