Python
Photo by Miquel Parera on Unsplash
Introdução
Temos nessa parte 1 (link para a parte 2 clicando aqui) desse artigo um dataset (download pode ser feito no meu github. Link no final do artigo) de dados bancários, por exemplo, saldo, se possui cartão de credito, número de investimentos e etc. Nele, temos 10000 linhas e 14 colunas de dados sobre os clientes de três diferentes países (França, Alemanha e Espanha) e, no final, se o cliente deixou ou não o banco (Churn). Churn acontece quando uma pessoa é cliente, nesse caso do banco, e depois de um tempo determinado decide deixar a empresa. Isso pode acontecer por diversos motivos que deverão ser analisados para tentar reduzir a taxa de churn (churn rate).
O arquivo em PDF, dataset e todo o código pode ser encontrado aqui.
Objetivo
O objetivo desse artigo é determinar a taxa de churn total, relacionar os dados disponíveis para ter insights sobre qual(is) grupos de clientes possuem a(s) maior(es) taxas de churn para que o banco possa atuar nesse(s) grupo(s), a fim de reduzi-las ao máximo.
Análise
Figura 1 – Dados
Na figura 1, temos os dados coletados. Nele podemos ver diversas informações como país de residência (Geography), idade (Age), Balance (saldo em conta) e etc. A última coluna temos Exited, indicando se a pessoa é ou não cliente do banco. NumOfProducts representa quantos investimentos a pessoa tem no banco, HasCrCard se possui cartão de credito e IsActiveMember se possui outros serviços oferecidos pelo banco como seguros.
Figura 2 – Quantidade de homens e mulheres
Figura 3 – Histograma de idade
Para começar, temos que a quantidade d homens é superior a de mulheres, figura 1, e que a maior parte dos clientes tem entre 30 e 45 anos, informação obtida pelo histograma da figura 3.
Figura 4- Quantidade de clientes que deixaram o banco
Na figura 4, temos a quantidade de clientes que deixaram o banco, separados por país e gênero. Aqui vemos que na França e Alemanha são os 2 países que mais possuem maior numero de pessoas que deixaram de ser clientes do banco. Além disso, vemos que nos três países, mais mulheres deixam de ser clientes do que os homens. Na França, por exemplo, elas representam 56,8 % das pessoas que deixam de serem clientes.
Figura 5 – Credit score
Fonte: https://www.nerdwallet.com/article/finance/credit-score-ranges-and-how-to-improve
Figura 6 – Churn rate por grupo de credit Score
Temos que quanto maior o credit score de um indivíduo, figura 5, melhores taxas de empréstimo ele consegue, melhores termos e etc. Na figura 6, vemos que a diferença entre os grupos de credit score não interfere no churn rate, já que todos estão próximos. No grupo menor que 400, temos 100%, pois são apenas 19 entradas e todas elas resultaram nos clientes deixando o banco, mas esse número é muito menor que os outros grupos, portando não deve ser levado em consideração.
Figura 7 – Churn rate por grupo de idade
Como temos a disposição a idade de todos, podemos criar faixas de idade para melhor analisarmos o churn rate para cada grupo de idade. Na figura 7, vemos que as maiores taxas de churn são nos grupos de entre 40 e 49 anos e 50 e 59 anos. No último, a taxa chega a ultrapassar 50 %, isso significa que mais da metade das pessoas nessa faixa de idade deixam o banco.
Figura 8 – Churn rate pelo NumberOfProducts
Figura 9 – Churn rate por HasCrCard
Figura 10 – Churn rate por activemember
Vemos que nas figuras 8,9 e 10, os grupos entre 40 e 49 e entre 50 e 59 possuem a maior churn rate dentre os todos os grupos. Nas figuras 8 e 9, a taxa passa, novamente, de 50 %. Um dos problemas pode ser que os clientes estejam insatisfeitos com o retorno dos investimentos, figura 7, e, na figura 8, talvez outra empresa está fornecendo cartões de créditos com mais vantagens para esses grupos de idade.
Juntamente com os resultados da figura 7, temos já comprovado que esses 2 grupos são os mais problemáticos e que merecem mais atenção por parte do banco. Deve-se investigar mais a fundo motivo das pessoas com cartão de credito e com investimentos no banco resolveram deixa-lo.
Na figura 10, possuir algum outro tipo de serviço do banco também está afetando a taxa de churn, talvez pelo serviço mal prestado, atendimento e etc. Esse ponto também deve ser investigado.
No total, considerando se a pessoa deixou ou não de ser cliente do banco, sem considerar os grupos de idade ou de creditscore, temos que o churn rate é de 20,37 %. Esse resultado é considerado ruim, já que no mercado um churn rate aceitável seria de 2 a 8 %.
Figura 11 – Boxplot de Balance
Na figura 11, podemos observar que nos grupos entre 40 e 49, menor que 29 anos e maior que 60 anos, temos que eles possuem mais saldo em conta quando resolveram não serem mais clientes. A diferença é significativa nos últimos 2.
Figura 12 – Boxplot de EstimatedSalary
Já na figura 12, o salário estimado dos clientes pelo banco não parece afetar muito a churn rate, portanto não é um ponto de preocupação.
Figura 13 – Boxplot de Tenure
Por fim, na figura 13, temos que um tenure menor (tempo para pagar, por exemplo, empréstimos) nos grupos entre 40 e 49 anos, 50 e 59 anos e menor que 29 anos, os mesmos com um churn rate maior apresentados anteriormente, são mais propensos a deixarem o banco.
Conclusões
Com todas as visualizações feitas, podemos tirar as seguintes conclusões. São elas:
1- Churn rate total foi de 20,37 %.
2- CreditScore e EstimatedSalary não influenciam na decisão de deixar o banco.
3- O maior churn rate por grupo de idade foi o de 50 e 59 anos com 56,04 %.
4-NumberOfProducts, HasCrCard e ActiveMember se motraram que contribuem para o churn rate, especialmente para o grupo de idade de 50 a 59 anos.
5- Tenure e balance afetam, mas pouco a decisão de deixar o banco.
Recomendações
Com essas conclusões, podemos dar as seguintes recomendações para a empresa:
1- Investigar o motivo da saída massiva das pessoas com 50 a 59 anos.
2- Avaliar como os outros produtos e serviços, como cartões de credito e investimentos, oferecidos pelo banco estão afetando a perda de clientes.
Comentarios