Alternativa C - Estruturado, não estruturado e semiestruturado
Introdução ao Conceito
Um Data Lake (Lago de Dados) é um repositório centralizado projetado para armazenar grandes volumes de dados brutos. Sua principal característica é a flexibilidade, pois ele não impõe uma estrutura prévia aos dados antes do armazenamento.
Isso difere significativamente de um Data Warehouse, que geralmente exige que os dados sejam limpos e organizados previamente em esquemas rígidos.
Tipos de Dados Armazenáveis
A grande vantagem do Data Lake reside na sua capacidade de aceitar qualquer formato de dado. Podemos classificar esses formatos em três categorias principais:
- Dados Estruturados: Possuem um modelo de dados fixo e organizado em linhas e colunas.
- Exemplos: Tabelas de banco de dados SQL, planilhas Excel.
- Dados Semiestruturados: Contêm algumas propriedades organizacionais, mas não seguem um esquema rígido de tabela.
- Exemplos: Arquivos JSON, XML, logs de servidores.
- Dados Não Estruturados: Não possuem nenhum modelo de dados predefinido.
- Exemplos: Imagens, vídeos, áudios, documentos de texto (PDF, Word), e-mails.
Análise das Alternativas
| Alternativa | Análise |
|---|
| A | Incorreta. Limita-se apenas a dados organizados, ignorando a flexibilidade do Data Lake. |
| B | Incorreta. Embora inclua dados organizados e parcialmente organizados, exclui os não estruturados. |
| C | Correta. Abrange todas as formas possíveis de dados, que é a essência do conceito. |
| D | Incorreta. Exclui os dados estruturados, que são frequentemente armazenados em Data Lakes. |
| E | Incorreta. Refere-se exclusivamente a bancos de dados relacionais tradicionais. |
Conclusão
Portanto, a definição correta de um Data Lake envolve a capacidade de ingerir e armazenar dados de todas as naturezas, sem necessidade de transformação imediata.
Alternativa C.