Matemática — Estatística Múltipla Escolha

(FGV/2016) Existem dois métodos relativamente usuais para identificar, num conjunto de dados, valores não aderentes, denominados outliers. Um deles utiliza uma distribuição teórica, enquanto o outro emprega duas medidas descritivas, uma de posição e outra de dispersão. A propósito:

(FGV/2016) Existem dois métodos relativamente usuais para identificar, num conjunto de dados, valores não aderentes, denominados outliers. Um deles utiliza uma distribuição teórica, enquanto o outro emprega duas medidas descritivas, uma de posição e outra de dispersão. A propósito:

  1. o método Box Plot é baseado em estatísticas de ordem
  2. as distribuições das estatísticas do máximo e do mínimo são empregadas no método do z score.
  3. o método Box Plot emprega intervalos de confiança ao redor da média amostral para identificar outliers.
  4. o método do z score utiliza como regra para a identificação dos outliers o desvio interquartílico.
  5. o método da distribuição Qui-quadrado é empregado para testar a aderência de valores espúrios.

Resolução completa

Explicação passo a passo

A
Alternativa A

Alternativa A - O método Box Plot é baseado em estatísticas de ordem

Introdução à Identificação de Outliers

Outliers (ou valores aberrantes) são observações que se desviam significativamente das outras observações em um conjunto de dados. A questão da FGV/2016 aborda os dois métodos mais comuns para detectá-los:

  1. Método Paramétrico (Teórico): Geralmente usa o Z-Score, assumindo que os dados seguem uma distribuição normal. Baseia-se na média e no desvio padrão.
  2. Método Não Paramétrico (Descritivo): Geralmente usa o Box Plot, baseando-se na mediana e nos quartis. É mais robusto porque não depende de pressupostos de distribuição.

## Análise Detalhada das Alternativas

Para encontrar a resposta correta, precisamos entender a natureza matemática das ferramentas mencionadas:

  • Alternativa A (Correta): O Box Plot (Diagrama de Caixa) constrói-se utilizando a Mediana, o Primeiro Quartil (Q_1) e o Terceiro Quartil (Q_3).
  • Os quartis são definidos pela posição relativa dos dados quando organizados em ordem crescente.
  • Na estatística, qualquer medida calculada baseada na posição ou classificação dos dados (como mínimo, máximo, mediana, quartis) é chamada de Estatística de Ordem.
  • Portanto, dizer que o Box Plot é baseado em estatísticas de ordem é tecnicamente preciso.
  • Alternativa B (Incorreta): O método do Z-Score padroniza os dados usando a média (\bar{x}) e o desvio padrão (s). Ele não utiliza as distribuições extremas do máximo e do mínimo diretamente; ele verifica quantos desvios-padrão um ponto está da média.
  • Alternativa C (Incorreta): O Box Plot utiliza a Mediana como centro, não a Média. Além disso, a detecção de outliers no Box Plot segue a regra do Intervalo Intercartil ($1,5 \times IQR$), não intervalos de confiança sobre a média.
  • Alternativa D (Incorreta): Há uma confusão entre as ferramentas aqui.
  • O Z-Score usa o Desvio Padrão.
  • O Box Plot usa o Desvio Intercartil (IQR = Q_3 - Q_1).
  • A alternativa diz o contrário.
  • Alternativa E (Incorreta): Embora o Qui-quadrado seja usado para testes de aderência de distribuições, não é o método padrão descrito no enunciado para identificação simples de outliers comparado aos métodos citados (teórico vs. descritivos).

Conclusão

A afirmação correta é que o método Box Plot é baseado em estatísticas de ordem, pois sua construção depende fundamentalmente da ordenação dos dados para calcular quartis e a mediana, tornando-o menos sensível a valores extremos do que métodos baseados na média.

Tem outra questão para resolver?

Resolver agora com IA

Mais questões de Matemática — Estatística

Ver mais Matemática — Estatística resolvidas

Tem outra questão de Matemática — Estatística?

Cole o enunciado, tire uma foto ou descreva o problema — a IA resolve com explicação completa em segundos.