Analisando dados parte 1.
Analisando dados parte 1.

Analisando dados parte 1.

Este projeto tem o objetivo de responder à seguinte pergunta: os indicadores socioeconômicos têm alguma correlação com os índices de transmissibilidade e os percentuais de morte em pacientes de Covid-19?
Será que índices como; maior ou menor nível educacional, renda per capita, densidade demográfica dos entes federativos do Brasil mudam a taxa de contaminação e os casos de obtidos da Covid-19?

Band Sera GIF by MasterChef Brasil - Find & Share on GIPHY

Hum… é hora de começar a analisar os dados para sabermos se vamos obter respostas das dúvidas acima.
Para isso vou visualizar alguns dados para verificar quais são as informações que cada dataframe  possuí e fazer algumas alterações e interligações usando comandos da nossa biblioteca querida, pandas.
Quais informações eu tenho na base do COVID-19?
Temos região, estado, município, alguns códigos, população TCU2019, casos, obtidos e etc.
Neste post vou abrir o meu csv e vou nomear ele de df1.

Feito isso, podemos só digitar o nome “df1” e ele vai abrir as portas da esperança e lhe mostra as informações ou você pode usar o comando “Head”, que vai mostra as 5 primeiras linhas do dataframe.

df1.head()

 

 

Quero verificar na coluna “estado” quais são os valores únicos dela, pois como vamos usar dois dataframes minha ideia é usar esta coluna como chave de interligação das duas. Então vamos precisar usar o comando “unique” depois de especificar a dataframe e a coluna.         Fica assim o comando;

     df1[‘estado’].unique

 

Agora quero ver um conjunto de dados de colunas específicas para verificar como eles estão arrumados.
Então você deve chamar o dataframe e entre colchetes chamas as colunas que deseja.

      df1[[‘estado’,’casosAcumulado’,’obitosAcumulado’]]

 

 

Meu índice está sendo a 1 coluna à esquerda de 0 a infinito, kkkkk, mas isso não me ajuda então vou mudar ele e vou tornar a coluna “estado” como meu índice.
Nossa senhora dos comandos me ajude.

       df1.set_index(‘estado’)

Roger Reza GIF by MasterChef Brasil - Find & Share on GIPHY

 

Blz e isso que eu quero então agora vamos deixa está alteração permanente no df1 através do implementação do comando “inplace”.
df1.set_index(‘estado’,inplace=True)

 

Eu sou meio chatinha, 🤣🤣🤣🤣 e este NaN ( dado não informado) nas primeiras linhas que se referem ao Brasil estão me provocando, logo vamos informar que nestas linhas da coluna “estado” quando aparecer o “NaN” ele troque por “Brasil”, utilizando o “fillna” vamos fazer esta alteração.

    df1[‘estado’].fillna(‘Brasil’)

 

Pronto, neste post eu paro por aqui pois agora vou aprender a concatenar os dados para poder fazer as interligações e aí visualizar os gráficos também.
Te espero no próximo.

Beijos, Maga.😘

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *