Análise exploratória de dados em uma linha de código
- #Python
A análise exploratória é um passo fundamental e certamente um dos primeiros em termos de analisar os dados, outra coisa que se sabe muito bem e que é um mantra da programação é "don't repeat yourself", de modo que performar as mesmas etapas em diferentes conjuntos de dados pode ser cansativo, e existe uma forma de realizar mais rapidamente, com o fasteda!
Fasteda
Como sugere o autor no repositório do fasteda, o módulo capaz de fornecer as primeiras impressões sobre o seu conjunto de dados.
Em sua estrutura ele é composto por numpy, pandas, matplotlib, seaborn, missingno, colorama e scipy.stats, sendo capaz de performar as seguintes tarefas:
- Head of dataframe (first 3 rows)
- Tail of dataframe (last 3 rows)
- Missing values count
- MSNO Matrix
- Shape
- Info()
- Describe()
- Correlation
- Pairplot
- Histplot(s) & Boxplot(s) subplot
- Countplot(s)
Fiz uma demostração de como instalar e usar o fasteda no Deepnote, vou compartilhar o link a quem tiver interesse: