A inteligência artificial e os algoritmos de aprendizagem são presença mais ou menos evidente no nosso quotidiano. Hoje, abrimos o smartphone e este indica-nos o local onde estacionámos o automóvel ou o tempo de viagem até casa, sem que tenhamos disponibilizado (conscientemente) os dados para estas predições.

Quando abrimos o Instagram e o Facebook reparamos que surgem anúncios comerciais sobre temas que se enquadram nas nossas preocupações. Antes de ser pai o meu feed do Facebook estava repleto de test drives a carros clássicos e a motas vintage. Mal a Clara nasceu, o algoritmo percebeu (antes do próprio utilizador) que os próximos meses seriam dominados por moda e farmacologia infantis.

Este exemplo estende-se às promoções do supermercado, desenvolvidas a partir do registo histórico das compras (seja via e-commerce ou através dos cartões de cliente que servem essencialmente para o retalhista ter acesso aos dados do consumidor). Curiosamente, reparei recentemente que o supermercado que utilizo está com dificuldade em atribuir-me um cluster.

Sou um cliente que faz compras em Lisboa e no Porto e adotei um perfil de aquisição um tanto ou quanto errático: em Lisboa compro gourmet e cervejas artesanais; no Porto sou um fanático por promoções e marcas brancas (a minha mulher não pode ler este artigo). Dito isto, a inteligência artificial encontra-se tanto nas nossas atividades mais vulgares, como nas mais sofisticadas (previsão de energia renovável, logística, microbiologia genética, robótica, etc.).

Trabalho na área de machine learning aplicada à indústria da energia e tenho-me surpreendido com a democratização da programação (hoje é mais fácil escrever código em Python do que no malogrado C++), com os ganhos de produtividade (há algoritmos off-the-shelf) e com a acessibilidade aos modelos (os engenheiros de dados normalmente trabalham com plataformas gratuitas, assentes numa comunidade extensa e dinâmica).

Surpreende-me, porém, que o marketing político e os departamentos de prospetiva e planeamento do Estado estejam a ignorar esta ciência, não obstante sabermos que, por exemplo, a campanha de 2008 de Barack Obama desenvolveu uma otimização dos recursos (humanos e financeiros) e da mensagem a veicular porta a porta, em função dos resultados de um algoritmo que era atualizado todas as noites. Estamos a falar de dados públicos e privados, recolhidos e tratados com a devida autorização (à luz do RGPD).

Um exemplo paradigmático do potencial da inteligência artificial reside nas finanças públicas. Tal como referi no artigo Rigor Orçamental, se nas (boas) empresas privadas já se utilizam ferramentas de machine learning para previsão financeira e operacional, é importante que o Governo convide a Universidade a participar na modernização da metodologia de construção do Orçamento do Estado.

Apresento de seguida um caso de estudo sobre a aplicação de modelos de aprendizagem à macroeconomia, nomeadamente a previsão da carga fiscal no ano seguinte. Nesta metodologia, em primeiro lugar, é necessário definir as variáveis do modelo. Não sendo economista, consultei os relatórios do Banco de Portugal e acabei por identificar os seguintes atributos: PIB (crescente/decrescente); saldo da balança comercial (crescente/decrescente); dívida pública (crescente/decrescente); e partido no governo (centro-esquerda ou centro-direita).

De seguida, constituí um dataset de 20 anos com registos históricos destes atributos e da carga fiscal. Tal como em qualquer modelo de aprendizagem, começa-se por criar um conjunto de treino, para posteriormente se aplicar o algoritmo a um conjunto de teste. Neste processo é possível “correr” vários modelos, tal como a regressão logística, as árvores de decisão, as redes neuronais, etc.. Atendendo à tipologia do problema, acabei por utilizar o modelo Naïve Bayes (assente na probabilidade condicionada).

Utilizando as previsões do Banco de Portugal e aplicando uma normalização aos atributos em estudo, em 2018 tem-se: PIB – decrescente; saldo da balança comercial – decrescente; dívida pública – crescente; partido no governo – centro-esquerda. Com este contexto, a probabilidade de em 2019 a carga fiscal ser superior à registada em 2018 é igual 60% (deixo para um próximo artigo o resultado deste estudo probabilístico, se estivesse o centro-direita no governo).

Este exercício é apenas um exemplo (sem rigor científico) do potencial da inteligência artificial aplicada à ciência política e à macroeconomia.