Análise do Comportamento de Consumo de Clientes
- #Python
Qual o comportamento de consumo dos clientes de empresas de telefonia?
Quais regiões são mais rentáveis para a companhia?
Quais planos dão mais receitas?
Trago pra vocês a Conclusão Geral da minha análise exploratória de dados, que teve como objetivo testar hipóteses quanto ao nível de receita de clientes por tipo de plano e por cidade de residência.
A base de dados é composta pelos consumos de 500 estadunidenses ao longo do ano de 2018.
Caso tenham interesse de ver a análise completa, basta clicar aqui.
Para além das respostas às perguntas acima, a análise traz:
- tratativas de valores ausentes e tipos de dados.
- refinamento de dados.
- junção de Dataframes.
- plotagem e visualização de dados.
- sugestões de política de negócios.
- teste de hipóteses.
Conclusão Geral
Inicialmente foi realizado uma descrição dos dados e DataFrames disponíveis. Após as análises iniciais do DataFrame, foram feitas correções ao nível de tipo dos dados.
Foi necessário um refinamento dos dados, tanto para adicionar novas variáveis que facilitassem nossas análises, como os excedentes de consumo, assim como o mês vinculado a cada receita dos clientes. Posteriormente foi necessário criar um DataFrame que fosse a junção de todos os outros necessários para a realização do estudo.
Os valores ausentes foram tratados, com exceção de uma variável, churn_date, que não era relevante para a concretização do estudo. Os outros valores ausentes foram substituídos por zero (0), uma vez que a ausência de consumo implica na não utilização. Após o refinamento, seguimos para as análises dos dados.
O comportamento e consumo dos clientes foram descritos. Também foi possível sugerir políticas de negócios e ações a serem tomadas pela empresa, visando uma maior fidelização e experiência de usuário para seus clientes, junto as suas próprias necessidades. A análise dos dados seguiu com a visualização em gráficos de histogramas e dispersão, tanto da visualização da receita, consumo e excedentes dos clientes, quanto da visualização da receita por idades e por cidades de residência dos usuários. Medidas de desvio padrão, variância, média e mediana foram realizadas para todo o DataFrame.
Por fim, foram realizados os testes de hipóteses para médias de amostras independentes, tanto para a hipótese da receita média serem iguais entre os usuários dos planos surf e ultimate, quanto para a hipótese da receita média dos usuários da cidade NY-NJ serem iguais às outras cidades. Vimos que as hipóteses nulas foram rejeitadas, indicando que há informações suficientes nos dados que, dado ao nível de significância do estudo, corroboram com a diferença entre essas receitas médias testadas.