Alternativa D - uma rede neural do tipo LSTM
Análise da Questão
A questão apresenta um cenário prático de seleção de modelo de Machine Learning (Aprendizado de Máquina) baseado nas características específicas dos dados. Para encontrar a resposta correta, precisamos identificar os termos-chave no enunciado.
Pontos Cruciais do Enunciado
- Dados: Textos.
- Forma de entrega: De forma sequencial ao modelo.
- Recursos: Dados em abundância e alta capacidade de processamento.
Por que LSTM?
A sigla LSTM significa Long Short-Term Memory (Memória de Curto e Longo Prazo). Ela é um tipo especial de Rede Neural Recorrente (RNN).
As RNNs e suas variantes (como LSTM) foram desenvolvidas especificamente para processar dados onde a ordem e o contexto temporal importam. Em textos, a palavra "não" antes de um adjetivo muda completamente o sentido da frase. Uma rede precisa lembrar do início da sequência para entender o final.
- Capacidade de memória: As LSTMs conseguem reter informações de passos anteriores na sequência, superando o problema de esquecimento de redes recorrentes comuns.
- Abundância de dados: Modelos baseados em redes neurais profundas, como LSTMs, exigem grandes volumes de dados para treinar efetivamente, o que condiz com o recurso disponível ("dados em abundância").
Por que não as outras alternativas?
| Alternativa | Tipo de Algoritmo | Por que não é a melhor escolha |
|---|
| A | Classificador Bayesiano | Funciona bem para texto, mas trata cada palavra como independente (na versão Naive), ignorando a estrutura sequencial profunda. |
| B | k-Means | É um algoritmo de agrupamento (clustering) não supervisionado, usado para organizar dados similares, não para classificar ou prever sequências. |
| C | k-NN (k-Nearest Neighbors) | Baseia-se na proximidade entre pontos. Não possui mecanismos internos para aprender padrões sequenciais complexos de linguagem. |
| E | CNN (Convolutional Neural Network) | Embora possa ser usada para texto (capturando n-grams), é nativa para dados espaciais (imagens). Para dados estritamente sequenciais como texto puro, a LSTM é a arquitetura canônica em contextos de prova. |
Conclusão
Devido à natureza sequencial dos dados textuais e à disponibilidade de recursos computacionais para treinar um modelo complexo, a recomendação técnica mais adequada é utilizar uma arquitetura capaz de manter o estado da rede através do tempo.
Alternativa D.