Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop?
Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop?
- YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas
- NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados
- MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo
- DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster
- Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes