Article image
Thiago Queiroz
Thiago Queiroz07/01/2023 11:51
Compartilhe

Análise do Comportamento de Consumo de Clientes

  • #Python

Qual o comportamento de consumo dos clientes de empresas de telefonia?

Quais regiões são mais rentáveis para a companhia?

Quais planos dão mais receitas?

Trago pra vocês a Conclusão Geral da minha análise exploratória de dados, que teve como objetivo testar hipóteses quanto ao nível de receita de clientes por tipo de plano e por cidade de residência.

A base de dados é composta pelos consumos de 500 estadunidenses ao longo do ano de 2018.

Caso tenham interesse de ver a análise completa, basta clicar aqui.

Para além das respostas às perguntas acima, a análise traz:

  • tratativas de valores ausentes e tipos de dados.
  • refinamento de dados.
  • junção de Dataframes.
  • plotagem e visualização de dados.
  • sugestões de política de negócios.
  • teste de hipóteses.

Conclusão Geral

Inicialmente foi realizado uma descrição dos dados e DataFrames disponíveis. Após as análises iniciais do DataFrame, foram feitas correções ao nível de tipo dos dados.

Foi necessário um refinamento dos dados, tanto para adicionar novas variáveis que facilitassem nossas análises, como os excedentes de consumo, assim como o mês vinculado a cada receita dos clientes. Posteriormente foi necessário criar um DataFrame que fosse a junção de todos os outros necessários para a realização do estudo.

Os valores ausentes foram tratados, com exceção de uma variável, churn_date, que não era relevante para a concretização do estudo. Os outros valores ausentes foram substituídos por zero (0), uma vez que a ausência de consumo implica na não utilização. Após o refinamento, seguimos para as análises dos dados.

image

O comportamento e consumo dos clientes foram descritos. Também foi possível sugerir políticas de negócios e ações a serem tomadas pela empresa, visando uma maior fidelização e experiência de usuário para seus clientes, junto as suas próprias necessidades. A análise dos dados seguiu com a visualização em gráficos de histogramas e dispersão, tanto da visualização da receita, consumo e excedentes dos clientes, quanto da visualização da receita por idades e por cidades de residência dos usuários. Medidas de desvio padrão, variância, média e mediana foram realizadas para todo o DataFrame.

image

Por fim, foram realizados os testes de hipóteses para médias de amostras independentes, tanto para a hipótese da receita média serem iguais entre os usuários dos planos surf e ultimate, quanto para a hipótese da receita média dos usuários da cidade NY-NJ serem iguais às outras cidades. Vimos que as hipóteses nulas foram rejeitadas, indicando que há informações suficientes nos dados que, dado ao nível de significância do estudo, corroboram com a diferença entre essas receitas médias testadas.

Compartilhe
Comentários (2)
Edney Landim
Edney Landim - 07/01/2023 13:12

Muito bom, parabéns

Thiago Henrique
Thiago Henrique - 07/01/2023 17:30

Parabéns, excelente projeto!