Matemática Múltipla Escolha

A maioria dos algoritmos de machine learning trabalha somente com dados numéricos. Uma das etapas de preparação de dados consiste em converter o texto das variáveis categóricas para um valor numérico. Assinale a alternativa que apresenta corretamente duas técnicas possíveis de serem utilizadas para tratar as variáveis categóricas.

A maioria dos algoritmos de machine learning trabalha somente com dados numéricos. Uma das etapas de preparação de dados consiste em converter o texto das variáveis categóricas para um valor numérico. Assinale a alternativa que apresenta corretamente duas técnicas possíveis de serem utilizadas para tratar as variáveis categóricas.

  1. Category Encoder e Label Encoder.
  2. One Hot Encoder e Category Encoder.
  3. Label Encoder e One Hot Encoder.
  4. Label Imputer e Category Encoder.
  5. One Hot Encoder e Label Imputer.

Resolução completa

Explicação passo a passo

C
Alternativa C

Alternativa C - Label Encoder e One Hot Encoder

Análise da Questão

O enunciado aborda um pré-requisito fundamental do Machine Learning: a necessidade de transformar dados não numéricos em números para que os algoritmos possam processá-los.

As variáveis categóricas (texto como "Sim/Não", "Vermelho/Azul") precisam ser codificadas. As duas técnicas mais comuns e padronizadas para isso são:

  • Label Encoder: Transforma cada categoria única em um número inteiro (ex: "Gato" = 0, "Cachorro" = 1). É simples, mas pode introduzir uma ordem falsa se os dados não forem ordinais.
  • One Hot Encoder: Cria colunas binárias (0 ou 1) para cada categoria. Isso evita que o modelo interprete uma hierarquia entre as categorias.

Por que as outras opções estão incorretas?

A confusão geralmente ocorre entre técnicas de codificação (Encoding) e tratamento de dados faltantes (Imputation).

TécnicaFunção PrincipalAdequada para Texto Categórico?
Label EncoderConverter texto em inteirosSim
One Hot EncoderConverter texto em vetores bináriosSim
Imputer (Label/Simple)Preencher valores nulos/faltantesNão (foco em dados vazios)
  • Opções com "Imputer": O termo Imputer refere-se ao preenchimento de valores ausentes (missing values), não à conversão de texto em número para variáveis categóricas completas.
  • Opções com "Category Encoder": Embora existam bibliotecas com esse nome, os termos técnicos universais e esperados em provas são Label Encoder e One Hot Encoder.

Conclusão: A combinação correta de técnicas de codificação para variáveis categóricas é Label Encoder e One Hot Encoder.

Tem outra questão para resolver?

Resolver agora com IA

Mais questões de Matemática

Ver mais Matemática resolvidas

Tem outra questão de Matemática?

Cole o enunciado, tire uma foto ou descreva o problema — a IA resolve com explicação completa em segundos.