Como transformar uma busca por produtos na Amazon em uma planilha de cotações
- #Data
- #Python
- #Selenium
Nesse artigo eu demonstro como utilizar a linguagem Python usando os pacotes Selenium e Pandas, para transformar uma busca por um produto em uma tabela em Pandas e Excel, o que facilita na hora de filtrar os produtos mais baratos ou filtrar por certas características do produto.
O script completo está no meu repositório do Github (segue abaixo o link):
https://github.com/phael8919/Web-scraping-Amazon
Observações:
- Sugiro utilizar o Jupyter Notebook para rodar os scripts;
- Mantenha a versão do Webdriver atualizada de acordo com a versão do seu navegador Google Chrome;
- A Amazon dificulta o WebScraping. Portanto, talvez seja necessário rodar o script mais de uma vez.
Explicando o funcionamento do script
Rode a 1ª célula e digite o nome do produto.
Observação: Tente ser o mais descritivo possível, pois isso ajuda na busca mais refinada do produto, como no exemplo abaixo:
Execute a 2ª célula:
O Script é executado e o site é aberto com o produto pesquisado:
Após a conclusão do script, é gerado uma tabela com três colunas: Nome do produto, Preço, e Link do produto:
Na célula seguinte, é gerado uma tabela ordenada por ordem crescente de preços:
Ao rodar a penúltima célula, é salvo um arquivo em Excel:
Na última célula, você consegue refinar a pesquisa, digitando por uma característica específica do produto, como o nome da marca: