Alternativa E - coeficiente de determinação
Análise da Questão
A questão aborda a avaliação de modelos de aprendizado de máquina, especificamente distinguindo entre tarefas de regressão e classificação.
1. Regressão vs. Classificação
- Classificação: O objetivo é prever uma categoria discreta (ex: "spam" ou "não spam", "gato" ou "cachorro"). Aqui, é possível contar acertos e erros exatos.
- Regressão: O objetivo é prever um valor contínuo (ex: preço de uma casa, temperatura, salário). Como os valores são contínuos, é estatisticamente improvável que a predição seja exatamente igual ao valor real. Por isso, não se fala em "taxa de acertos" (alternativas C e D).
2. Por que não usar Taxa de Acertos?
Como mencionado no enunciado, em regressão os valores previstos diferem dos reais. Para medir a qualidade, precisamos de métricas que quantifiquem o desvio ou a variância explicada, e não apenas se acertou ou errou.
3. O Coeficiente de Determinação (R^2)
Esta é a métrica fundamental para avaliar modelos de regressão linear. Ele indica a proporção da variância da variável dependente que é previsível a partir das variáveis independentes.
A fórmula básica do R^2 é:
R^2 = 1 - \frac{SS_{res}}{SS_{tot}}
Onde:
- SS_{res} é a soma dos quadrados dos resíduos (erros do modelo).
- SS_{tot} é a soma total dos quadrados (variabilidade total dos dados).
Interpretação:
- Um R^2 próximo de 1 indica que o modelo explica quase toda a variação dos dados (bom ajuste).
- Um R^2 próximo de 0 indica que o modelo não explica bem a variação.
Resumo das Alternativas Incorretas
- A e B: "Coeficiente de erros" e "coeficiente de inércia" não são termos padronizados principais para essa finalidade específica em regressão linear básica.
- C e D: Taxa de acertos/erros são métricas típicas de classificação, não de regressão numérica contínua.
Portanto, a medida adequada para avaliar a qualidade do modelo de regressão linear é o coeficiente de determinação.