Primeiro Desafio da Alura de Data Science sobre redução da taxa de evasão de clientes, chamado de Churn Rate.
Como cientista de dados pela operadora de telecomunicações Alura Voz. Na reunião inicial com as pessoas responsáveis pela área de vendas da empresa, foi explicada a importância de se reduzir a Taxa de Evasão de Clientes, conhecido como Churn Rate. Basicamente, o Churn Rate indica o quanto a empresa perdeu de receita ou clientes em um período de tempo.
o projeto foi desenvolvido utilizando Python no jupyter notebook e utilizamos suas bibliotecas voltadas para análise, modelagem e por fim na predição dos dados. Foram utilizadas as seguintes bibliotecas:
O conjunto de dados bruto pode ser encontrado neste Repositório da Alura Voz. O notebook pode ser reproduzido em qualquer IDLE de preferência, mas recomendamos utlizar o google colab para maior facilidade.
Para prosseguirmos vamos separar o projeto em 3 etapas.
-
Preprocessing Pré-processamento dos dados etapa voltada para pre processar os dados, visando corrigir inconsistências e estruturar corretamente para que os dados fiquem tabulados perfeitamente para modelar.
-
Data visualization Visualização de dados a fim de facilitar a análise dados vamos construir gráficos para gerar insights e observar a distribuição das variáveis sobretudo a de interesse (Churn Rate).
-
Predictive modelling Modelagem preditiva em conlusão depois de analisar o conjunto de dados, estamos prontos para decidir qual modelo apropriado para o projeto, ao mesmo tempo a métrica a fim de avaliar o modelo.