O primeiro passo da jornada, as escolhas.👻👻👻
Qual linguagem de programação usar R ou Python?
- Python– mais versátil, forte integração com framework web, e com Deep Learning, integração com ferramentas em Cloud, linguagem orientada a objetos.
- R – mais recursos estatísticos de manipulação e visualização, menos opções de Deep Learning, linguagem orientada a funções.
No fim continua sendo o gosto e o perfil de cada usuário.
Usar um programa instalado fisicamente no computador como o Júpiter ou usar a Cloud com o Google Colaboratory ( conhecido como colab)?
- Cloud – disponibilidade, flexibilidade de recursos, integrações pré definidas, rapidez de compartilhamento.
- Físico – é local, permite acesso a arquivos locais mais facilmente, não necessita de internet para programar.
Usar uma versão paga ou free?
- Esta depende do bolso de cada um.
São tantas as dúvidas ???🤔🤔🤔
Então vamos começar com minhas primeiras escolhas.
Neste projeto de mineração de dados vou utilizar uma ferramenta free com a linguagem de programação Python na Cloud com o Google Colab.
Simbora então ativar na sua conta do nosso queridinho Google mais uma ferramenta, o Colab, por que eu escolhi ele; já é em Python na Cloud, já tem várias bibliotecas pré disponíveis que eu tenho interesse de usar para fazer o tratamento dos dados e criar gráficos, e aqui pra nós eu adoro o Google 🤫 é segredo não conta pra ninguém!
Vamos ao passo a passo para usar o Colab:
- Abra o Google Drive;
- Crie uma nova pasta para o seu projeto;
- Clique em ‘Novo’ > ‘Mais’> ‘Colaboratory’.
Pronto ativado olha que gracinha.
Ele tem vários recursos que você pode personalizar como mudar a cor do console, usar a potência dos servidores da Google com o GPU, integrar com o Github e com o Google Drive e muito mais caso você queira saber mais é só dar uma olhada neste site do Google https://colab.research.google.com/notebooks/intro.ipynb?hl=pt_BR#scrollTo=5fCEDCU_qrC0
Eu vou utilizar inicialmente a configuração default do colab.
Agora eu vou adicionar algumas bibliotecas no meu Python, são elas; pandas, seaborn, matplotlib. Por que estas? 🤔 Posto que quero estudar e praticar elas neste projeto.
Sim é qual o projeto? Vocês devem estar se perguntando.
Minha ideia é usar os dados governamentais sobre a Covid-19 e fazer alguns cruzamentos com dados socioeconômico dos estados do Brasil. E através da mineração dos dados verificar o que encontraremos com esta integração de dados.
Nós vemos no próximo post. Me desejem sorte.🤞🤞🤞
Beijos Maga.
Muito interessante! Boa sorte nessa jornada!