Matemática — Estatística Múltipla Escolha

A maioria dos algoritmos de machine learning trabalha somente com dados numéricos. Uma das etapas da preparação de dados consiste em converter o texto das variáveis categóricas para um valor numérico. Assinale a alternativa correta que apresenta o método útil para obter uma descrição dos dados, em particular o número de linhas, o tipo de cada variável e o número de valores nulos.

A maioria dos algoritmos de machine learning trabalha somente com dados numéricos. Uma das etapas da preparação de dados consiste em converter o texto das variáveis categóricas para um valor numérico. Assinale a alternativa correta que apresenta o método útil para obter uma descrição dos dados, em particular o número de linhas, o tipo de cada variável e o número de valores nulos.

  1. .shape()
  2. .dtypes()
  3. .info()
  4. .describe()
  5. .head()

Resolução completa

Explicação passo a passo

C
Alternativa C

Alternativa C - .info()

Introdução

A questão aborda o uso da biblioteca Pandas em Python, fundamental para manipulação de dados e ciência de dados. O objetivo é identificar qual método fornece um resumo estrutural do DataFrame, incluindo quantidade de linhas, tipos de variáveis e informações sobre dados ausentes.

Desenvolvimento

Para responder corretamente, é necessário conhecer as funções básicas de inspeção de objetos em Pandas. A função solicitada deve entregar três informações específicas simultaneamente:

  1. Número de linhas: Quantidade total de registros.
  2. Tipo de cada variável: Se são números, texto, datas, etc.
  3. Números de valores nulos: Dados faltantes na estrutura.

A alternativa correta é o método .info(). Este comando exibe um resumo conciso de um DataFrame. Ele mostra o intervalo de índices (indicando o número de linhas), lista as colunas com seus respectivos tipos de dados (dtype) e apresenta a contagem de entradas não nulas (Non-Null Count), permitindo identificar onde existem valores vazios.

Análise das Alternativas

Vamos analisar por que as outras opções não atendem a todos os requisitos do enunciado:

  • .shape(): Retorna apenas a forma do objeto (tupla com número de linhas e número de colunas). Não informa tipos de dados nem nulos.
  • .dtypes(): Retorna exclusivamente os tipos de dados de cada coluna. Não fornece a contagem de linhas ou nulos.
  • .describe(): Gera estatísticas descritivas (mínimo, máximo, média, desvio padrão, quartis). Foca em dados numéricos e não mostra os tipos de todas as colunas ou contagem de nulos de forma explícita.
  • .head(): Exibe as primeiras N linhas do conjunto de dados (padrão 5). Serve para visualização rápida, não para análise estrutural.
MétodoInformações PrincipaisAtende ao Enunciado?
.shape()Linhas e ColunasNão
.dtypes()Tipos de dadosNão
.info()Estrutura, Tipos, Contagem não nulaSim
.describe()Estatísticas NuméricasNão
.head()Visualização das linhasNão

Conclusão

O método .info() é a ferramenta padrão para diagnosticar a saúde inicial de um conjunto de dados durante a fase de exploratory data analysis (EDA). Ele permite ao analista entender rapidamente a dimensionalidade, a natureza dos dados e a qualidade (presença de nulos) antes de aplicar algoritmos de machine learning.

Portanto, a alternativa correta é a que contém o comando .info(), correspondente à Alternativa C.

Tem outra questão para resolver?

Resolver agora com IA

Mais questões de Matemática — Estatística

Ver mais Matemática — Estatística resolvidas

Tem outra questão de Matemática — Estatística?

Cole o enunciado, tire uma foto ou descreva o problema — a IA resolve com explicação completa em segundos.