Article image
Thiago Queiroz
Thiago Queiroz28/12/2022 18:41
Compartilhe

Quais Fatores Influenciam a Venda de um Veículo?

  • #GitHub
  • #Git
  • #Python

Segue-se a conclusão de uma Análise Exploratória de Dados (EDA) baseada em anúncios para venda de veículos dos Estados Unidos da América. Essa EDA tem como objetivo responder as seguintes perguntas:

  • Quais são as principais características que afetam o preço de venda de um veículo?
  • Qual o tempo de vida de um anúncio de veículo?
  • Quais os veículos que são mais vendáveis?
  • Quais os veículos costumam ser mais caros que outros?

Para além de responder as perguntas, nesse notebook também são apresentados as tratativas de valores ausentes e atípicos.

Para ver esse projeto na íntegra, basta clicar aqui.

CONCLUSÃO GERAL

Após as análises iniciais do DataFrame, foram feitas correções ao nível de duplicatas implícitas e de tipo dos dados.

A existência de valores ausentes levou a procura por preenchê-los da melhor maneira possível. Após verificar que nenhuma característica era responsável por dominar a existência de valores ausentes nos dados, foi iniciado o preenchimento da variável cylinders utilizando o modelo do veículo, uma vez que a fabricação do veículo define a quantidade de cilindros que aquele modelo de motor vai ter. O ano do modelo, variável model_year, foi preenchido com auxílio da variável model, já que os modelos dos veículos definem, com bastante precisão, o ano em que aqueles veículos foram fabricados.

Os valores ausentes na quilometragem, variável odometer, foram preenchidos de acordo com o estado de conservação do veículo, uma vez que veículos mal conservados costumam ter alta quilometragem, ao nível que veículos mais bem conservados possuem os menores valores de quilometragens.

A variável is_4wd foi identificada como boolean com valores zero (0) ausentes, assim foi relativamente simples preencher/trocar os valores faltantes por zero.

Já a variável da cor do veículo, paint_color, foi a mais complexa para realizar seu preenchimento, uma vez que estudos comprovam que a cor do veículo afeta o seu preço de venda — principal objetivo desse estudo. Nesse sentido, e de forma a ser razoável com o preenchimento, foi escolhido a cor que mais se repetia entre os mesmo modelos de veículos, a moda (frequência).

image

Uma outra análise que foi realizada foi o tratamento dos valores atípicos. A criação dos intervalos interquartis (IQR) foram imprescindíveis para identificar e tratar esses valores da base de dados.

image

Em seguida foram analisados o novo DataFrame através de gráficos de histograma e bloxpot, com e sem sobreposição, e criação de linhas de limites inferiores e superiores. Nessa etapa os gráficos se mostraram mais claros e perceptíveis, com a ausência dos valores extremos.

Verificou-se o tempo médio de existência da publicação dos anúncios, que são de 39.5 dias. Além de identificarmos os anúncios que foram removidos em menos de um dia de publicados. Já por outro lado, os anúncios mais demorados foram os que superaram 104 dias de publicação.

Foi identificado também que as categorias truck e SUV são as duas com maiores montantes de preço anunciados pela plataforma, com mais de 167 e 124 milhões de dólares, respectivamente. O preço médio da categoria truck ultrapassa 15 mil dólares, enquanto a categoria SUV possui um preço médio superior a 10 mil dólares.

Por fim, a matriz de correlação lançou luz sobre as principais variáveis que afetam o preço dos veículos nos anúncios. Nas quais, as principais foram a idade do veículo, quilometragem, quantidade de cilindros e se o carro possui ou não a característica 4x4.

image

Com a utilização de gráficos de dispersão, bem como boxplots, foi possível corroborar com os estudos da iSeeCars que identificam que veículos com certas cores são mais caros que outros. Além de reforçar que veículos em melhores condições de conservação tendem a atingirem maiores preços nos anúncios.

Compartilhe
Comentários (3)

RR

Renato Rodrigues - 28/12/2022 18:52

aa÷%%=

RR

Renato Rodrigues - 28/12/2022 18:52


RR

Renato Rodrigues - 28/12/2022 18:51

Artigo de mais ser trabalhar com tigo mais tradicionais