Skip to content

Latest commit

 

History

History
63 lines (35 loc) · 3.48 KB

README.md

File metadata and controls

63 lines (35 loc) · 3.48 KB

Desafios de Ciência de Dados

en

Este repositório traz 4 desafios que envolvem assuntos como análise de dados, automação de processos, aprendizado de máquina, dentre outros assuntos relacionados a Ciência de Dados.

Os problemas aqui são comuns a muitas empresas e podem ser resolvidos através do estudo dos dados disponíveis das mesmas. A partir dessa análise e utilizando alguma linguagem de programação a nosso favor é possível detectar padrões e obter insights para possíveis tomadas de decisões que ajudariam a empresa a solucionar o problema pelo qual está passando.

Desafio 1

O primeiro desafio se trata de reunir informações sobre 25 Shoppings a partir de uma planilha em Excel com mais de 100.000 linhas e enviar o relatório de cada Shopping para o email de seu respectivo gerente.

Como todo esse processo se feito de forma manual seria extremamente repetitivo e cansativo, este desafio será resolvido com uma simples Automação de Processos.

Bibliotecas e pacotes utilizados: pandas, smtplib, email. Leia detalhadamente sobre esse desafio aqui.

Desafio 2

O segundo desafio se trata de uma empresa de cartões de crédito que estão perdendo clientes progressivamente e gostaria de entender melhor o motivo que está levando tantos clientes a cancelarem seus cartões.

Portanto, farei uma Análise de Dados a partir de uma planilha com os dados de seus clientes para formar o perfil dos clientes que estão cancelando seus cartões, para que assim a empresa saiba exatamente onde pode focar para mudar esta situação.

Bibliotecas e pacotes utilizados: pandas, plotly. Leia detalhadamente sobre esse desafio aqui.

Desafio 3

Este é um super desafio que envolve Machine Learning e Business Intelligence. O terceiro desafio se trata de criar uma ferramenta para auxiliar pessoas a saberem quanto elas devem cobrar pela diária do seu imóvel e também auxiliar aquele que está buscando uma estadia a saber se o preço dos imóveis buscados estão justos ou não.

Esse é um desafio que mostra como funciona na prática um projeto de Ciência de Dados. Ele envolve, basicamente, oito etapas:

  1. Entendimento do desafio
  2. Avaliação do projeto/área
  3. Extração e obtenção de dados
  4. Ajuste de dados (limpeza)
  5. Análise exploratória
  6. Modelagem e algoritmos
  7. Interpretação do resultado
  8. Conclusão

Bibliotecas e pacotes utilizados: pandas, pathlib, numpy, seaborn, matplotlib, plotly, sklearn. Leia detalhadamente sobre esse desafio aqui.

Desafio 4

O quarto desafio se trata de uma empresa em expansão que precisa enviar, todos os dias, boletos de cobrança para seus clientes inadimplentes.

Como se trata de um processo bastante repetitivo, é favorável utilizar Automação de Processos, tornando tudo mais simples e automático. O mais interessante desse desafio é que é necessário automatizar um processo que é feito através do navegador e envolve algumas etapas intrigantes.

Bibliotecas e pacotes utilizados: pandas, time, selenium. Leia detalhadamente sobre esse desafio aqui.


Licença

MIT © Gabriel Reira