Engenharia Múltipla Escolha

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele.

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele.

  1. Apenas estruturado
  2. Estruturado e semiestruturado
  3. Estruturado, não estruturado e semiestruturado
  4. Apenas não estruturado
  5. Apenas tabelas relacionais

Resolução completa

Explicação passo a passo

C
Alternativa C

Alternativa C - Estruturado, não estruturado e semiestruturado

Introdução ao Conceito

Um Data Lake (Lago de Dados) é um repositório centralizado projetado para armazenar grandes volumes de dados brutos. Sua principal característica é a flexibilidade, pois ele não impõe uma estrutura prévia aos dados antes do armazenamento.

Isso difere significativamente de um Data Warehouse, que geralmente exige que os dados sejam limpos e organizados previamente em esquemas rígidos.

Tipos de Dados Armazenáveis

A grande vantagem do Data Lake reside na sua capacidade de aceitar qualquer formato de dado. Podemos classificar esses formatos em três categorias principais:

  • Dados Estruturados: Possuem um modelo de dados fixo e organizado em linhas e colunas.
  • Exemplos: Tabelas de banco de dados SQL, planilhas Excel.
  • Dados Semiestruturados: Contêm algumas propriedades organizacionais, mas não seguem um esquema rígido de tabela.
  • Exemplos: Arquivos JSON, XML, logs de servidores.
  • Dados Não Estruturados: Não possuem nenhum modelo de dados predefinido.
  • Exemplos: Imagens, vídeos, áudios, documentos de texto (PDF, Word), e-mails.

Análise das Alternativas

AlternativaAnálise
AIncorreta. Limita-se apenas a dados organizados, ignorando a flexibilidade do Data Lake.
BIncorreta. Embora inclua dados organizados e parcialmente organizados, exclui os não estruturados.
CCorreta. Abrange todas as formas possíveis de dados, que é a essência do conceito.
DIncorreta. Exclui os dados estruturados, que são frequentemente armazenados em Data Lakes.
EIncorreta. Refere-se exclusivamente a bancos de dados relacionais tradicionais.

Conclusão

Portanto, a definição correta de um Data Lake envolve a capacidade de ingerir e armazenar dados de todas as naturezas, sem necessidade de transformação imediata.

Alternativa C.

Tem outra questão para resolver?

Resolver agora com IA

Mais questões de Engenharia

Ver mais Engenharia resolvidas

Tem outra questão de Engenharia?

Cole o enunciado, tire uma foto ou descreva o problema — a IA resolve com explicação completa em segundos.