Improving the Forecasts of European Regional Banks’ Profitability with Machine Learning Algorithms

Abstract: Regional banks as savings and cooperative banks are widespread in continental Europe. In the aftermath of the financial crisis, however, they had problems keeping their profitability which is an important quantitative indicator for the health of a bank and the banking sector overall. We use a large data set of bank-level balance sheet items and regional economic variables to forecast profitability for about 2,000 regional banks. Machine learning algorithms are able to beat traditional estimators as ordinary least squares as well as autoregressive models in forecasting performance.

Conclusion: In the aftermath of the financial crisis regional banks had problems keeping up their profitability. Banks’ profitability is an important indicator for the stability of the banking sector. We use a data set of bank-level balance sheet items and regional economic variables to forecast profitability. For the 2,000 savings and cooperative banks from eight European countries and the 2000-2015 time period, we found that machine learning algorithms are able to beat traditional estimators as ordinary least squares as well as autoregressive models in forecasting performance. Therefore, our paper is in line with the literature on machine learning models and their superior forecasting performance (Khandani et al., 2010; Butaru et al., 2016; Fitzpatrick & Mues, 2016). The performance of the machine learning algorithms was particularly well during the European debt crisis which points out the importance of our forecasting exercise as during this time policy makers’ interest in banks’ profitability was enhanced as further potential rescue packages for banks could deteriorate fiscal stability. Policy makers and, especially, regulators should therefore use these algorithms instead of traditional estimators in combination with their even larger regulatory data sets in regard to size and frequency to forecast banks’ profitability or other balance sheet items of interest.

Improving the Forecasts of European Regional Banks_ Profi tability with Machine Learning Algorithms

Anúncios
Improving the Forecasts of European Regional Banks’ Profitability with Machine Learning Algorithms

Base de Dados Econômicos da Prússia

Seguindo a recomendação do blog do Prof. Cláudio (um dos melhores blogs de economia) segue a indicação de uma nova base de dados para alegria dos Data Miners. Dados históricos da Prússia. Há diversos arquivos CSV que contém desde informações demográficas até indicadores econômicos. Vale a pena garimpar.

Base de Dados Econômicos da Prússia

Economistas como Cientistas de Dados

Neste post do Econometric Sense, há uma importante reflexão sobre o papel dos economistas como cientistas de dados, e como as habilidades de domínio econômico, juntamente com background matemático possibilita que os mesmos exerçam esse tipo de atividade.

Esse tipo de post coloca mais uma vez em perspectiva toda a área de análise de dados, no qual a mesma está convergindo para papéis importantes dentro das organizações, onde o banco de dados como na visão dos DBAs (um grande repositório) está virando uma commodity, na qual quem não se qualificar e ter o entendimento dos dados será tratado pelo mercado como commodity e será remunerado como tal. Mas isso é um tema para um outro post.

Esse artigo do Silvio Meira, é um clássico para TODOS da área de Computação e afins.

Economistas como Cientistas de Dados

Porque Não-Espionar os Dados

Neste post do Análise Real (lido no dia, mas só revisado hoje) há uma interessante discussão relativa a ‘fitagem’ de modelos e relacionamento e consistência dos resultados. O melhor trecho sem dúvida é a seguinte passagem:

“[…]Qualquer um que seja péssimo em tiro ao alvo pode “melhorar” seu resultado. Basta permitir que se atire antes e em seguida o alvo seja desenhado da maneira que lhe parecer mais favorável.  Perceba que a “evidência” resultante concordará com a hipótese que você quer provar. Entretanto, ela não é nem um pouco severa, pois, mesmo se você não fosse um bom atirador, você poderia ter obtido o mesmo resultado. Sendo incapaz de discriminar entre um caso e outro, na verdade este “teste” – em sua forma bruta – não poderia se considerado evidência genuína de sua habilidade.

Na analogia, os tiros são os “dados” e o desenho o “modelo” ou “hipótese”. Se você fizer seu modelo, ou formular sua hipótese, utilizando as peculiaridades dos dados – e não levar em conta este fato na sua inferência – você pode estar simplesmente desenhando um alvo ao redor dos tiros.
[…]”

Vale a pena a leitura, e as referências.

Porque Não-Espionar os Dados

Economia Computacional

Apesar de não ter relação direta ao objetivo desse site, esse ramo da economia tem muito a ver com aprendizado de máquina, especialmente na modelagem de domínio;  e potencialmente pode ser uma das disciplinas obrigatórias para todos os que trabalham diretamente com modelagem de projetos de mineração de dados aplicado a projetos econômicos devido ao alto grau de complexidade de transpor modelos econômicos complexos em aprendizado de máquina. Esse site do professor Vincent Conitzer da Duke University tem ótimos materiais para quem deseja iniciar nesse campo de estudos, com arquivos que explicam a teoria e aplicação prática da economia computacional.

Economia Computacional

Algorithmic Finance Journal

Um dos bons achados na internet, é esse excelente Journal of Algorithmic Finance que entre outros aspectos inerentes á área das finanças tem trabalhos muito interessantes sobre aplicação desses modelos dentro da esfera computacional. Vale a pena conferir.

Algorithmic Finance Journal

Why Economics Needs Data Mining – Cosma Shalizi

Essa entrevista do professor Cosma Shalizi (Michigan University) é uma boa prova de uma das aplicações mais emergentes da mineração de dados que é no campo da economia.

A Economia é uma ciência social que tem uma ligação muito forte com as ciências exatas como a matemática e a estatística; e o ponto que o professor Cosma coloca em questão nessa entrevista é que há muitos modelos econômicos que lidam com variáveis dinâmicas, mas que não se comportam assim no momento de sua validação devido à sua complexidade e formas de adequação nem sempre adequadas tomadas pelos economistas, e ele propõe que seja utilizado o aprendizado de máquina e conceitos de estatísticas para melhor definição dos modelos econômicos.

Para quem desejar conhecer um pouco mais, esse é o link do seu programa de Mineração de Dados.

Why Economics Needs Data Mining – Cosma Shalizi