Programação Python (Parte 3) - Prof. MARCO VAZ

MarcoVaz
204K views

Open Source Your Knowledge, Become a Contributor

Technology knowledge has to be shared and made accessible for free. Join the movement.

Create Content

Pacote Pandas

Pandas DataFrame

Pandas DataFrame é uma estrutura de dados bidimensional com os dados alinhados de forma tabular em linhas e colunas, mutável em tamanho e potencialmente heterogênea, semelhantemente a uma pasta de trabalho do MS-EXCEL. A diferença essencial é que os nomes de colunas e os números de linha são conhecidos como índice de coluna e linha, no caso do DataFrame. As colunas possuem nomes (índice da coluna) e, as linhas, podem ter nomes referentes a colunas e as linhas podem ter nomes (índices textuais) ou podem, por padrão, ser numeradas (Índice numérico).

funcao

Criando um DataFrame

Em geral, o DataFrame pode conter dados a partir de:

  • Um DataFrame do Pandas
#Importando a biblioteca Pandas
In [1]: import pandas as pd

#Criando um Dataframe com 2 linhas (indexes 0 e 1) e 4 colunas ('Idade', 'Sexo', 'Peso', 'Altura').
In [2]: meu_df = pd.DataFrame([[21,'F', 50, 1.57],[22,'F',58, 1.70]], index=range(0,2), columns=['Idade', 'Sexo', 'Peso', 'Altura'])

#Exibindo o DataFrame criado
In [3]: meu_df
Out[3]: 
   Idade Sexo  Peso  Altura
0     21    F    50    1.57
1     22    F    58    1.70

#Acesso as linhas do DataFrame a partir do seu índice. Utilizar a função .iloc[indice].
#Exibir a segunda linha do Dataframe
In [4]: meu_df.iloc[1]
Out[4]: 
Idade      22
Sexo        F
Peso       58
Altura    1.7
Name: 1, dtype: object
  • Uma Série Pandas: um array unidimensional capaz de armazenar qualquer tipo de dados com rótulos ou índice de eixo. Um exemplo de um objeto Series é uma coluna de um DataFrame.
#Criando uma Série formada por nomes e com índices de 0 até 4.
In [4]: nomes = pd.Series(["Luciano","Matheus", "Rodrigo", "Bruno", "Michel"], index=range(0,5))

#Criando um DataFrame a partir da Serie nomes com a coluna denominada Nomes    
In [5]: df = pd.DataFrame(data=nomes, columns=['Nomes'])

In [6]: df
Out[6]: 
     Nomes
0  Luciano
1  Matheus
2  Rodrigo
3    Bruno
4   Michel

Open Source Your Knowledge: become a Contributor and help others learn. Create New Content