Introdução ao pandas: Seus primeiros comandos

Introduzindo o Pandas

Hoje o artigo será uma Introdução ao Pandas, uma das principais ferramentas de um analista de dados.

O Pandas é uma biblioteca da linguagem de Programação Python, ele oferece diversas ferramentas para lidar com um grande volume de dados.

Sirva-se com seu cafezinho ou chá, e vamos para mais uma rodada de conhecimento!

Instalação da biblioteca Pandas

Antes de mais nada, precisamos instalar nossa biblioteca, temos duas principais formas de fazer isso:

  1. Pelo terminal:
pip-install-pandas
Instalação do pandas

        2. Pelo Jupyter Notebook:

pip-install-pandas-jupyter
Instalação do pandas – Jupyter

Importação da biblioteca

Com a biblioteca instalada podemos partir para a sua importação, vamos ver o código abaixo e depois uma breve explicação:

import-pandas-as-pd
Importação da biblioteca

Para importar o pandas para o seu arquivo usa-se o comando “import”.

O “pd” escrito no código é como se fosse um apelido que déssemos a biblioteca.

Mas por que?

Bom, para executar comandos pandas usamos o nome da biblioteca + função desejada.

Veja um exemplo:

pd.read_excel()

Porém, digitar “pandas” diversas vezes em uma análise acaba sendo contra produtivo.

Diante disso, é um consenso da comunidade apelidar bibliotecas (não somente o pandas, como várias outras) para siglas mais curtas.

pd.read_excel()

DataFrame

Um dos conceitos mais importantes dos pandas é o DataFrame.

Ele basicamente representa uma tabela de dados retangular e contém uma coleção ordenada e nomeada de colunas, com cada uma delas podendo ser de um tipo diferente (string, int, float, etc).

Lembra um pouco uma tabela em Excel ou as tabelas que aparecem em consultas SQL.

Exemplo de montagem de um DataFrame usando Pandas:

dataframe pandas

Retorno esperado:

retorno dataframe pandas

Lendo dados de arquivos

Agora vamos aprender a ler arquivos de dados.

O pandas permite a importação de diversos tipos de arquivos como CSV, Excel, SQL, HTML, etc.

Vamos ver dois exemplos, um importando um arquivo CSV e outro um arquivo Excel.

read_csv

Comandos básicos no pandas

Visualizando os dados

No início de qualquer análise de dados em pandas é sempre interessante darmos uma olhada geral nas 5 primeiras linhas e 5 últimas linhas da nossa base.

Por que?

Para termos uma ideia de que tipo de dados iremos trabalhar e quais colunas temos.

Para vermos as 5 primeiras linhas:

pd.head

Exemplo de retorno:

retorno pd.head()

Para vermos as 5 últimas linhas:

pd.tail()

Exemplo de retorno:

retorno pd.tail()

Informações sobre o DataFrame

Podemos ter um resumo geral das colunas e tipos de dados com um simples código:

pd.info

Exemplo de retorno:

retorno pd.info

Também temos um comando que nos retorna um resumo estatístico dos dados numéricos:

pd.describe

Exemplo de retorno:

retorno pd.describe

 

Conclusão

O pandas é uma ferramenta muito poderosa para um profissional de dados, com simples comandos podemos extrair de forma rápida informações valiosas da nossa base de dados.

Não se prenda somente a essa introdução ao pandas, explore mais sobre essa ferramenta!

Em breve teremos conteúdos bem aprofundados sobre essa incrível ferramenta!

Recomendações de conteúdo:

Python para análise de dados: /amzn.to/4gnYJO1

Estatística prática: https: /amzn.to/4ip1HmX

 

Agradecemos imensamente a leitura, lembre-se de conferir nossos conteúdos em https://perspectivadosdados.com/, trazemos todos os dias novos conteúdos sobre análise de dados, economia e finanças!

Sumário

Leia também:

Análise exploratória A análise exploratória de dados (AED) é uma etapa fundamental em qualquer análise que visa uma boa qualidade. É ela quem vai ajudar...

O que é limpeza de dados? Limpeza de dados é o processo de encontrar possíveis problemas no seus dados que podem comprometer suas analises. Antes...

Compartilhe!
plugins premium WordPress