Alternativa B
Introdução
Os Modelos de Linguagem de Grande Escala (LLMs) aprendem identificando padrões estatísticos em grandes volumes de dados. Durante o treinamento, o modelo analisa textos para prever sequências de palavras e construir representações do conhecimento humano.
Se esses dados de entrada contêm informações discriminatórias ou estereotipadas, o modelo não tem capacidade nativa para distinguir entre fatos objetivos e preconceitos sociais.
Análise Detalhada
- Princípio Fundamental: Em aprendizado de máquina, vigora o conceito "Garbage In, Garbage Out" (Lixo entra, lixo sai). Se os dados de treinamento forem enviesados, o resultado final será enviesado.
- Por que a Alternativa B está correta: O modelo pode aprender e reproduzir esses vieses. Ele otimiza seus parâmetros para minimizar erros de predição baseados no que viu. Se viu associações preconceituosas frequentes, ele as generaliza.
- Por que a Alternativa A está incorreta: Modelos não possuem consciência ética automática. Eles não filtram vieses sem intervenções humanas específicas (como Fine-tuning com Reinforcement Learning from Human Feedback).
- Por que as Alternativas C e D estão incorretas: O viés impacta todas as tarefas de Processamento de Linguagem Natural (NLP), incluindo redação, análise de sentimentos e tradução, não sendo restrito apenas a matemática ou tradução.
| Conceito | Explicação |
|---|
| Viés de Dados | Preconceitos presentes no conjunto de treinamento |
| Reprodução | O modelo replica os padrões aprendidos nos dados |
| Mitigação | Requer intervenção humana e auditoria contínua |
Conclusão
A resposta correta é a Alternativa B, pois destaca o risco principal associado ao uso de dados não neutros no treinamento de inteligência artificial: a perpetuação e amplificação de preconceitos existentes na sociedade.