Introduzindo o Pandas
Hoje o artigo será uma Introdução ao Pandas, uma das principais ferramentas de um analista de dados.
O Pandas é uma biblioteca da linguagem de Programação Python, ele oferece diversas ferramentas para lidar com um grande volume de dados.
Sirva-se com seu cafezinho ou chá, e vamos para mais uma rodada de conhecimento!
Instalação da biblioteca Pandas
Antes de mais nada, precisamos instalar nossa biblioteca, temos duas principais formas de fazer isso:
- Pelo terminal:

2. Pelo Jupyter Notebook:

Importação da biblioteca
Com a biblioteca instalada podemos partir para a sua importação, vamos ver o código abaixo e depois uma breve explicação:

Para importar o pandas para o seu arquivo usa-se o comando “import”.
O “pd” escrito no código é como se fosse um apelido que déssemos a biblioteca.
Mas por que?
Bom, para executar comandos pandas usamos o nome da biblioteca + função desejada.
Veja um exemplo:
Porém, digitar “pandas” diversas vezes em uma análise acaba sendo contra produtivo.
Diante disso, é um consenso da comunidade apelidar bibliotecas (não somente o pandas, como várias outras) para siglas mais curtas.
DataFrame
Um dos conceitos mais importantes dos pandas é o DataFrame.
Ele basicamente representa uma tabela de dados retangular e contém uma coleção ordenada e nomeada de colunas, com cada uma delas podendo ser de um tipo diferente (string, int, float, etc).
Lembra um pouco uma tabela em Excel ou as tabelas que aparecem em consultas SQL.
Exemplo de montagem de um DataFrame usando Pandas:
Retorno esperado:
Lendo dados de arquivos
Agora vamos aprender a ler arquivos de dados.
O pandas permite a importação de diversos tipos de arquivos como CSV, Excel, SQL, HTML, etc.
Vamos ver dois exemplos, um importando um arquivo CSV e outro um arquivo Excel.
Comandos básicos no pandas
Visualizando os dados
No início de qualquer análise de dados em pandas é sempre interessante darmos uma olhada geral nas 5 primeiras linhas e 5 últimas linhas da nossa base.
Por que?
Para termos uma ideia de que tipo de dados iremos trabalhar e quais colunas temos.
Para vermos as 5 primeiras linhas:
Exemplo de retorno:
Para vermos as 5 últimas linhas:
Exemplo de retorno:
Informações sobre o DataFrame
Podemos ter um resumo geral das colunas e tipos de dados com um simples código:
Exemplo de retorno:
Também temos um comando que nos retorna um resumo estatístico dos dados numéricos:
Exemplo de retorno:
Conclusão
O pandas é uma ferramenta muito poderosa para um profissional de dados, com simples comandos podemos extrair de forma rápida informações valiosas da nossa base de dados.
Não se prenda somente a essa introdução ao pandas, explore mais sobre essa ferramenta!
Em breve teremos conteúdos bem aprofundados sobre essa incrível ferramenta!
Recomendações de conteúdo:
Python para análise de dados: /amzn.to/4gnYJO1
Estatística prática: https: /amzn.to/4ip1HmX
Agradecemos imensamente a leitura, lembre-se de conferir nossos conteúdos em https://perspectivadosdados.com/, trazemos todos os dias novos conteúdos sobre análise de dados, economia e finanças!