Alternativa A - O método Box Plot é baseado em estatísticas de ordem
Introdução à Identificação de Outliers
Outliers (ou valores aberrantes) são observações que se desviam significativamente das outras observações em um conjunto de dados. A questão da FGV/2016 aborda os dois métodos mais comuns para detectá-los:
- Método Paramétrico (Teórico): Geralmente usa o Z-Score, assumindo que os dados seguem uma distribuição normal. Baseia-se na média e no desvio padrão.
- Método Não Paramétrico (Descritivo): Geralmente usa o Box Plot, baseando-se na mediana e nos quartis. É mais robusto porque não depende de pressupostos de distribuição.
## Análise Detalhada das Alternativas
Para encontrar a resposta correta, precisamos entender a natureza matemática das ferramentas mencionadas:
- Alternativa A (Correta): O Box Plot (Diagrama de Caixa) constrói-se utilizando a Mediana, o Primeiro Quartil (Q_1) e o Terceiro Quartil (Q_3).
- Os quartis são definidos pela posição relativa dos dados quando organizados em ordem crescente.
- Na estatística, qualquer medida calculada baseada na posição ou classificação dos dados (como mínimo, máximo, mediana, quartis) é chamada de Estatística de Ordem.
- Portanto, dizer que o Box Plot é baseado em estatísticas de ordem é tecnicamente preciso.
- Alternativa B (Incorreta): O método do Z-Score padroniza os dados usando a média (\bar{x}) e o desvio padrão (s). Ele não utiliza as distribuições extremas do máximo e do mínimo diretamente; ele verifica quantos desvios-padrão um ponto está da média.
- Alternativa C (Incorreta): O Box Plot utiliza a Mediana como centro, não a Média. Além disso, a detecção de outliers no Box Plot segue a regra do Intervalo Intercartil ($1,5 \times IQR$), não intervalos de confiança sobre a média.
- Alternativa D (Incorreta): Há uma confusão entre as ferramentas aqui.
- O Z-Score usa o Desvio Padrão.
- O Box Plot usa o Desvio Intercartil (IQR = Q_3 - Q_1).
- A alternativa diz o contrário.
- Alternativa E (Incorreta): Embora o Qui-quadrado seja usado para testes de aderência de distribuições, não é o método padrão descrito no enunciado para identificação simples de outliers comparado aos métodos citados (teórico vs. descritivos).
Conclusão
A afirmação correta é que o método Box Plot é baseado em estatísticas de ordem, pois sua construção depende fundamentalmente da ordenação dos dados para calcular quartis e a mediana, tornando-o menos sensível a valores extremos do que métodos baseados na média.