Geral Múltipla Escolha

O que pode acontecer se um LLM receber dados enviesados durante o treinamento?

O que pode acontecer se um LLM receber dados enviesados durante o treinamento?

  1. O modelo eliminará os vieses automaticamente.
  2. O modelo pode aprender e reproduzir esses vieses.
  3. O modelo só funcionará para tarefas matemáticas.
  4. Muda apenas a performance em tarefas de tradução.

Resolução completa

Explicação passo a passo

B
Alternativa B

Alternativa B

Introdução
Os Modelos de Linguagem de Grande Escala (LLMs) aprendem identificando padrões estatísticos em grandes volumes de dados. Durante o treinamento, o modelo analisa textos para prever sequências de palavras e construir representações do conhecimento humano.

Se esses dados de entrada contêm informações discriminatórias ou estereotipadas, o modelo não tem capacidade nativa para distinguir entre fatos objetivos e preconceitos sociais.

Análise Detalhada

  • Princípio Fundamental: Em aprendizado de máquina, vigora o conceito "Garbage In, Garbage Out" (Lixo entra, lixo sai). Se os dados de treinamento forem enviesados, o resultado final será enviesado.
  • Por que a Alternativa B está correta: O modelo pode aprender e reproduzir esses vieses. Ele otimiza seus parâmetros para minimizar erros de predição baseados no que viu. Se viu associações preconceituosas frequentes, ele as generaliza.
  • Por que a Alternativa A está incorreta: Modelos não possuem consciência ética automática. Eles não filtram vieses sem intervenções humanas específicas (como Fine-tuning com Reinforcement Learning from Human Feedback).
  • Por que as Alternativas C e D estão incorretas: O viés impacta todas as tarefas de Processamento de Linguagem Natural (NLP), incluindo redação, análise de sentimentos e tradução, não sendo restrito apenas a matemática ou tradução.
ConceitoExplicação
Viés de DadosPreconceitos presentes no conjunto de treinamento
ReproduçãoO modelo replica os padrões aprendidos nos dados
MitigaçãoRequer intervenção humana e auditoria contínua

Conclusão
A resposta correta é a Alternativa B, pois destaca o risco principal associado ao uso de dados não neutros no treinamento de inteligência artificial: a perpetuação e amplificação de preconceitos existentes na sociedade.

Tem outra questão para resolver?

Resolver agora com IA

Mais questões de Geral

Ver mais Geral resolvidas

Tem outra questão de Geral?

Cole o enunciado, tire uma foto ou descreva o problema — a IA resolve com explicação completa em segundos.