Engenharia Múltipla Escolha

Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop?

Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop?

  1. YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas
  2. NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados
  3. MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo
  4. DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster
  5. Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes

Resolução completa

Explicação passo a passo

D
Alternativa D

Alternativa D - DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster

Análise Detalhada

Para responder corretamente a esta questão, é fundamental compreender a arquitetura do Hadoop, especificamente o seu sistema de arquivos distribuído, conhecido como HDFS (Hadoop Distributed File System).

No modelo mestre/trabalhador do Hadoop, existem dois papéis principais no armazenamento:

  • NameNode: Atua como o ponto central de controle. Ele guarda os metadados (informações sobre a estrutura dos arquivos, nomes, permissões e onde cada bloco está localizado), mas não armazena os dados efetivos.
  • DataNode: São os nós trabalhadores que realizam o trabalho pesado. Eles recebem os dados e os armazenam fisicamente em seus discos rígidos, gerenciando os blocos de dados.

Comparativo das Alternativas

ComponenteFunção PrincipalArmazena Dados?
NameNodeGerenciamento de metadados e namespaceNão (apenas informações)
DataNodeArmazenamento físico dos blocosSim (Dados Efetivos)
YARNAgendamento e gerenciamento de recursosNão
MapReduceProcessamento paralelo de dadosNão
Hadoop CommonBibliotecas compartilhadasNão

Portanto, a alternativa D é a correta porque o DataNode é o componente que efetivamente grava e mantém os dados persistidos no disco dentro do cluster, enquanto o NameNode apenas guia o sistema informando onde esses dados estão.

Tem outra questão para resolver?

Resolver agora com IA

Mais questões de Engenharia

Ver mais Engenharia resolvidas

Tem outra questão de Engenharia?

Cole o enunciado, tire uma foto ou descreva o problema — a IA resolve com explicação completa em segundos.