Análise das Alternativas
A seguir, uma análise didática de cada opção, destacando por que a Alternativa E é a mais completa.
Alternativa A: Limpeza de Formatação
- Foco: Corrigir erros de digitação, espaçamento e padrões de texto.
- Limitação: Não resolve diferenças de significado (semântica). Por exemplo, "CNAE 1234" pode ter descrições diferentes em fontes distintas, mas a limpeza não unifica o conceito.
- Conclusão: Insuficiente para problemas semânticos.
Alternativa B: Padronização de Código
- Foco: Usar um código padrão (ex: CNAE oficial) para todas as fontes.
- Limitação: Não garante que o código seja interpretado corretamente. Sem enriquecimento semântico, não há como rastrear como o código foi mapeado de cada fonte original.
- Conclusão: Melhor que A, mas ainda incompleta para rastreabilidade.
Alternativa C: Transformação Única
- Foco: Aplicar uma regra fixa para converter dados.
- Limitação: Perde o histórico de transformações. Se a regra mudar, não há como auditar versões antigas.
- Conclusão: Compromete a rastreabilidade.
Alternativa D: Fusão de Dados
- Foco: Combinar registros de diferentes fontes em um único registro.
- Limitação: Pode causar perda de dados originais ou conflitos não resolvidos. Não mantém metadados de origem.
- Conclusão: Arriscado para integridade e auditoria.
Alternativa E: Enriquecimento Semântico com Regras Versionadas
- Foco: Usa dicionários de referência para entender o significado, mantém histórico de regras e mapeia metadados.
- Vantagem: Resolve divergências semânticas, garante rastreabilidade e permite auditoria.
- Conclusão: A mais completa e adequada.
Conclusão
A Alternativa E é a correta porque combina enriquecimento semântico, regras versionadas e mapeamento de metadados, essenciais para resolver divergências semânticas mantendo integridade e rastreabilidade.