Na área da cibersegurança os fabricantes de software têm investido muito no desenvolvimento e integração de algoritmos de aprendizagem automática nos seus produtos. Têm surgido novos programas que prometem a deteção de ciberataques com base na análise de padrões de tráfego e o comportamento dos utilizadores nas suas sessões de trabalho, permitindo respostas mais rápidas por parte das equipas de segurança. Têm também surgido motores de análise de código fonte que conseguem identificar erros de programação e escreverem automaticamente um programa que os explore.
Uma das questões que se levanta para a adoção destas novas tecnologias está relacionada com a dependência do ser humano para treinar os algoritmos a fim de evitar taxas altas de falsos positivos. Uma vez que as deteções são feitas com base na aprendizagem de padrões, cria-se um desafio para quem desenvolve e para quem explora as vulnerabilidades dos sistemas. Por um lado os hackers têm hoje um novo desafio que poderá passar pela criação de técnicas que permitam enganar os algoritmos, através da injeção de padrões (low and slow) e para quem desenvolve a criação de estratégias que permitam ao algoritmo identificar que algo ou alguém lhe está a tentar alterar o comportamento.
Numa altura em que se debate o Regulamento Geral sobre a Proteção de Dados (RGPD) e o direito à privacidade, o mesmo desafio é colocado a quem trata grandes volumes de dados com recurso a algoritmos de aprendizagem. Assistimos recentemente a um caso paradigmático sobre os dados extraídos de uma das maiores redes sociais em que a análise de ações aparentemente inofensivas como a atribuição de likes, permitiu através de técnicas de psicometria (ciência que estuda técnicas de medição psicológica) identificar perfis psicológicos mais vulneráreis à partilha de informação falsa, sem que ninguém se apercebesse. A exploração desta falha algorítmica teve um impacto muito significativo na organização e corrigi-la levará cerca de três anos de acordo com os responsáveis.
Os dados da aprendizagem automática estão lançados e cabe agora aos fabricantes e organizações trabalharem em conjunto para terem cada vez melhor informação e algoritmos para a tratar.