Analisando dados parte 2 a missão…rs!
Analisando dados parte 2 a missão…rs!

Analisando dados parte 2 a missão…rs!

Top Chef Reality GIF by Top Chef Brasil - Find & Share on GIPHY

 

E estamos de volta com mais alguns  conhecimentos, uhuu!!!

Então vou adicionar na pasta projeto no Colab mais dataframes, agora são os dados de cada estado da federação retirados do site do IBGE.

 

Vamos verificar uma das dataframes, peguei de exemplo o Acre.

 

Ok dataframe está com todas as informações que o IBGE  disponibiliza com estimativas até  o ano de 2060, esta brincando ou quer mais.

Agora é hora de fazer algumas alterações

Neste  existe a coluna Acre,  e em suas linhas o nome por extenso do estado. Pra deixa tudo padrão  vamos trocar o nome da coluna de Acre para Estado e nas linhas em vez do nome do estado por extenso vamos colocar sigla dele.

Primeiro comando para trocarmos o nome da coluna.

 

dfAcre.rename(columns={‘Acre’:’Estado’},inplace=True)

Legenda

dfAcre = nome do dataframe que tem os dados do Acre.

Rename = comando do pandas que permite fazer  alteração  dos nomes.

Columns = parâmetro do que você deseja alterar neste caso coluna

{‘Acre’:’Estado’} = informações entre chaves {‘nome da coluna ‘ : ‘novo nome da coluna’ }

inplace=True = para que as alterações já sejam salvas na dataframe do Acre.

O comando rename tem vários parâmetros  caso você  deseje estudar mais um pouco aí vai o link da biblioteca do pandas a parte específica deste comando.

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.rename.html?highlight=rename#pandas.DataFrame.rename

Beleza até  aqui, agora vamos alterar em todas as linhas no campo de Estado em vez do nome do estado por extenso vamos colocar a sigla dele.

Mas um comando para nossa listinha.

Tell Me More To Do List GIF by Disney Channel - Find & Share on GIPHY

 

dfAcre[‘Estado’].replace(‘Acre’,’AC’,inplace=True)
Depois da legenda lá emcima tenho certeza que está todo mundos safo. 😉
Mas Maga cadê  o link da biblioteca pandas  do comando replace? Né isso que vocês estão falando aí ☺️.
Já  está  na mão.
Vamos  vê como ficou nossa dataframe do Acre com estas alterações.
Agora é arrumar os dados das outras 26 unidades federativas pra deixa tudo no padrão, vou deixa no código tudo mas vamos pular aqui para próxima etapa. Que é … isso mesmo juntar todos os 27 estado em uma dataframe só. Pra isso vamos usar mais um comando do pandas quem adivinha qual será ?
Isso aí todo mundo esperto vamos usar o comando concat.
Aí você como eu,  pergunta.
Mas porque o concat é não o join ou o merge ou append?
 E sua resposta vai ser sanada com este quadrinho que resume onde utilizar cada um, obrigada quadrinho.🙌
Muito da hora isso, né. Então vamos para o comando.
df_estados = pd.concat([dfAcre,dfAlagoas],axis=0,ignore_index=True)
Legenda:
df_estados = nome que quero da a nova dataframe que vai ter as informações  concatenadas.
pd.concat = comando do pandas
[dfAcre,dfAlagoas] = nome das dataframe que vamos junta
axis=0 = o axis  faz referência ao eixo que nos vamos junta visto que o concat pergunte juntarmos tanto por linhas quando por colunas o eixo 0 e a linha é o eixo 1 é  coluna.
ignore_index=True = este parâmetro é  pra que nosso índice não fique com vários números repetidos e sim que ele fique sequencial,  como se nada tivesse acontecido.
E lógico vamos da um unique na coluna Estado para vê quantos valores únicos  aparece.
df_estados[‘Estado’].unique ()
E mais um link da biblioteca pandas, agora do comando concat.
E tem mais coisas????
O se tem, mas depois de tanto comando novo e as bibliotecas para aprender os parâmetros, vamos da uma paradinha  e continua no próximo post , vou ficar te esperando.
Beijos, Maga.😘

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *