Boas-vindas a mais um curso de visualização de dados da Alura!
Esse Github foi produzido com muito carinho para você montar o seu portfólio com as atividades do curso e elaborar suas próprias hipóteses, testar as técnicas exploradas dentro do curso e também adicionar outras durante a leitura das documentações de bibliotecas de visualização de dados com a linguagem Python: Matplotlib, Seaborn e Plotly.
O objetivo deste curso é auxiliar você a utilizar a linguagem Python na análise de dados por meio da agregação de recursos visuais, recorrendo a gráficos como ferramentas de exploração e apresentação dos dados ao seu público. É importante que você tenha um conhecimento básico das bibliotecas de visualização de Python, bem como das bibliotecas de manipulação de dados como Pandas e Numpy.
Neste curso, vamos construir um portfólio com as análises de duas bases de dados diferentes, explorando cada uma e respondendo aos questionamentos levantados em torno de seus dados. Todas as bases estão no formato CSV e podem ser acessadas por meio do Github.
Bases de dados:
- Vendas de uma rede de lojas de departamentos que opera em todo Brasil
- Distribuição de volumes e medidas de produtos de uma empresa de itens de limpeza
- Volume de um amaciante de 1L em um total de 1000 amostras medidas.
- Medidas de altura, comprimento e largura de uma caixa de sabão em pó em um total de 1000 amostras medidas
Como sugestão para escolha da paleta de cores para o seu projeto existem sites como o Coolor ou imagecolorpicker. As cores utilizadas nesse projeto são:
Azul | ||||
---|---|---|---|---|
AZUL1 | AZUL2 | AZUL3 | AZUL4 | AZUL5 |
#03045e | #0077b6 | #00b4d8 | #90e0ef | #CDDBF3 |
Cinza | ||||
---|---|---|---|---|
CINZA1 | CINZA2 | CINZA3 | CINZA4 | CINZA5 |
#212529 | #495057 | #adb5bd | #dee2e6 | #f8f9fa |
Misto | ||||
---|---|---|---|---|
VERMELHO1 | LARANJA1 | AMARELO1 | VERDE1 | VERDE2 |
#e76f51 | #f4a261 | #e9c46a | #0C8040 | #4c956c |
Na imagem abaixo, apresentamos um diagrama com diversos tipos de visualização de dados (criado por Andrew Abela) em que é possível perceber 4 subgrupos, dentre eles:
- Comparação
- Distribuição
- Relacionamento
- Composição
Para este curso focamos nos subgrupos da Comparação e Distribuição, levando em conta as observações que gostaríamos de apresentar em nosso portfólio.
Neste projeto, vamos explorar diversos gráficos de comparação dentre eles:
- Gráficos de Colunas
- Gráficos de Barras
- Gráficos de Barras e Colunas Empilhadas
- Gráficos de Linhas
Neste projeto, vamos explorar diversos gráficos de distribuição dentre eles:
- Histograma de Colunas
- Histograma de Linhas
- Gráficos de Densidade
- Boxplot
- Violin Plot
- Gráficos de Dispersão
Para verificar um resumo com os principais gráficos gerados ao longo curso clique nesse link
Esse curso teve como objetivo apresentar os diferentes tipos de visualização de dados e como escolher qual é o mais adequado para representar as análises de acordo com as perguntas e demandas requisitadas para o problema. Durante o curso, você aprendeu a criar gráficos de comparação e distribuição dos dados partindo do uso das bibliotecas mais utilizadas em Python, personalizar os gráficos e adicionar outros recursos visuais como anotações, destaques, legenda de dados e outras técnicas de visualização.
Ao final do curso, você será capaz de gerar visualizações personalizadas e voltadas ao tipo de público que você deseja. Ainda exploraremos os outros subgrupos com mais visualizações e técnicas para apresentar seus dados a seu público.
Sinta-se à vontade para fazer o fork desse projeto e construir o seu portfólio 😊