Os resultados obtidos nas últimas décadas pelos investigadores de inteligência artificial tornaram-se rapidamente familiares e passaram a fazer parte do nosso dia a dia. Habituámo-nos a usar telemóveis que reconhecem a face do seu utilizador, a aceitar que os melhores jogadores de xadrez do mundo já não sejam seres humano, ou que sistemas de inteligência artificial elaborem textos em português fluente.
Todas estas capacidades resultam de um esforço prolongado de investigação que demorou muitas décadas a atingir resultados e são vistas como conquistas desta área que veio a ficar globalmente conhecida como “inteligência artificial”. Apesar disso, os três resultados que citei acima, descritos de forma mais completa no meu recente livro “A Inteligência Artificial Generativa”, publicado pela Fundação Francisco Manuel dos Santos, resultam de tecnologias bastante diversas entre si e de abordagens diferentes e complementares.
Os sistemas de visão, baseados nas chamadas redes neuronais convolucionais que evoluíram rapidamente a partir de 2012, foram treinados com milhões de imagens, cada uma delas devidamente classificada (rotulada) por um ser humano. Estas redes neuronais convolucionais foram treinadas para reproduzir estas classificações e, no processo, aprenderam a reconhecer objectos, rostos e imagens em geral. Tecnicamente, chama-se a este processo aprendizagem supervisionada, porque os dados foram classificados por seres humanos, que assim supervisionam o processo de treino.
Já as conquistas na área dos jogos, como o xadrez ou o Go (um jogo de origem oriental, mais complexo que o xadrez), que ocorreram principalmente a partir de 2016, resultam de um processo diferente. Sistemas como o AlphaZero (um descendente do AlphaGo) aprenderam a dominar estes jogos por experiência própria, jogando milhões de jogos contra si mesmos, usando uma técnica conhecida como aprendizagem por reforço. Não estiveram directamente envolvidos seres humanos neste processo de aprendizagem que decorreu, fundamentalmente, de forma autónoma, permitindo a estes sistemas descobrir novas técnicas e estratégias nestes jogos, até então desconhecidas da humanidade.
Finalmente, os espectaculares desenvolvimentos nas tecnologias da linguagem que ocorreram a partir de 2020 e se tornaram virais a partir de 2022 resultam de uma terceira e diferente abordagem. Aqui, os grandes modelos de linguagem não aprenderam nem por experiência própria como o AlphaZero nem a partir de rótulos criados por seres humanos explicitamente para o efeito, como aconteceu com os sistemas de visão desenvolvidos a partir de 2012.
De forma diferente, os modelos de linguagem foram treinados simplesmente para prever a próxima palavra que se segue a uma sequência de palavras, com base em milhões de textos obtidos da Internet, usando uma técnica de aprendizagem designada como auto-supervisionada, em que os modelos aprendem sem a existência de rótulos explicitamente construídos.
Cada uma destas abordagens tem as suas limitações. Os sistemas de visão estão limitados pela disponibilidade de dados (imagens) rotulados por seres humanos e não funcionam fora dos domínios em que foram treinados. Sistemas como o AlphaZero são extremamente competentes no seu domínio específico (jogos de tabuleiro, neste caso) mas são inúteis fora desse domínio. Finalmente, os grandes modelos de linguagem, apesar da sua flexibilidade, apenas cobrem temas sobre o qual já existe conhecimento porque foram treinados com base em textos gerados por seres humanos.
Isto significa que os mais recentes e poderosos sistemas de inteligência artificial, os grandes modelos de linguagem, estão limitados, na sua essência, aos dados com que foram treinados. Isto é verdade mesmo que estes sistemas sejam melhorados com diversas técnicas entretanto desenvolvidas, como a capacidade para raciocinar ou para usar informação da Web. Isto implica que os sistemas de inteligência artificial, nas versões actualmente existentes, dificilmente descobrirão novos resultados científicos, novas tecnologias ou novas formas de pensar.
Significa isto que estes sistemas estarão para sempre limitados pelo conhecimento que existe nos dados com que foram treinados?
A (talvez surpreendente) resposta é que isso não é necessariamente verdade. A nossa espécie descobriu (ou produziu), ao longo da história, uma enorme quantidade de novo conhecimento, nas mais diversas áreas. Foi este processo de acumular conhecimento ao longo de séculos que nos permitiu dar passos enormes na compreensão do mundo nas mais diversas áreas do conhecimento, da biologia à física e da matemática à electrónica. Este conhecimento foi adquirido como resultado da motivação individual e colectiva de muitos indivíduos, comunidades e sociedades. A interacção com o mundo físico e com os outros seres humanos permitiu-nos, ao longo dos séculos, identificar as leis que regem os fenómenos que observamos e utilizá-las em novas tecnologias.
O novo conhecimento não adveio unicamente da leitura dos textos existentes, muitos deles de origem religiosa e de duvidosa factualidade, mas sim da interacção experimental com o mundo físico e da aplicação do raciocínio aos resultados experimentais obtidos.
É por isso que a criação de agentes de inteligência artificial, capazes de interagir com outras entidades usando a Internet e com o mundo físico através de outros sistemas, como robots, câmaras ou sensores, traz consigo a promessa de um novo salto nos desenvolvimentos da tecnologia. Os novos sistemas, capazes de perceber o mundo através dos seus sensores e de nele actuar, das mais diversas formas, poderão aprender padrões para além daqueles que existem nos conteúdos criados por seres humanos, por mais ricos que estes conteúdos sejam.
A combinação das tecnologias de aprendizagem por reforço, usadas no AlphaZero, com a capacidade para interagir com o mundo real abre as portas a novos e potencialmente explosivos desenvolvimentos na capacidade destes sistemas. Deixando de estar limitados pelo conhecimento humano existente, os sistemas de inteligência artificial dotados de agência e capacidade de aprendizagem contínua poderão formular hipóteses, testá-las contra dados experimentais, formular novas teorias e descobrir/produzir conhecimento verdadeiramente novo.
É esta a promessa da nova geração de sistemas inteligentes, dotados de agência e capazes de prosseguir, de forma autónoma, objectivos complexos. O futuro dirá se esta promessa se concretizará e se os resultados obtidos serão úteis para que a civilização do futuro seja mais sustentável, inclusiva e humana.