Alternativa C - .info()
Introdução
A questão aborda o uso da biblioteca Pandas em Python, fundamental para manipulação de dados e ciência de dados. O objetivo é identificar qual método fornece um resumo estrutural do DataFrame, incluindo quantidade de linhas, tipos de variáveis e informações sobre dados ausentes.
Desenvolvimento
Para responder corretamente, é necessário conhecer as funções básicas de inspeção de objetos em Pandas. A função solicitada deve entregar três informações específicas simultaneamente:
- Número de linhas: Quantidade total de registros.
- Tipo de cada variável: Se são números, texto, datas, etc.
- Números de valores nulos: Dados faltantes na estrutura.
A alternativa correta é o método .info(). Este comando exibe um resumo conciso de um DataFrame. Ele mostra o intervalo de índices (indicando o número de linhas), lista as colunas com seus respectivos tipos de dados (dtype) e apresenta a contagem de entradas não nulas (Non-Null Count), permitindo identificar onde existem valores vazios.
Análise das Alternativas
Vamos analisar por que as outras opções não atendem a todos os requisitos do enunciado:
.shape(): Retorna apenas a forma do objeto (tupla com número de linhas e número de colunas). Não informa tipos de dados nem nulos..dtypes(): Retorna exclusivamente os tipos de dados de cada coluna. Não fornece a contagem de linhas ou nulos..describe(): Gera estatísticas descritivas (mínimo, máximo, média, desvio padrão, quartis). Foca em dados numéricos e não mostra os tipos de todas as colunas ou contagem de nulos de forma explícita..head(): Exibe as primeiras N linhas do conjunto de dados (padrão 5). Serve para visualização rápida, não para análise estrutural.
| Método | Informações Principais | Atende ao Enunciado? |
|---|
.shape() | Linhas e Colunas | Não |
.dtypes() | Tipos de dados | Não |
.info() | Estrutura, Tipos, Contagem não nula | Sim |
.describe() | Estatísticas Numéricas | Não |
.head() | Visualização das linhas | Não |
Conclusão
O método .info() é a ferramenta padrão para diagnosticar a saúde inicial de um conjunto de dados durante a fase de exploratory data analysis (EDA). Ele permite ao analista entender rapidamente a dimensionalidade, a natureza dos dados e a qualidade (presença de nulos) antes de aplicar algoritmos de machine learning.
Portanto, a alternativa correta é a que contém o comando .info(), correspondente à Alternativa C.