[weglot_switcher]

‘Amália’ com investimento de 5,5 milhões e financiado por PRR

‘Amália’ chega oficialmente até março. Sabe-se que será coordenado e desenvolvimento por entidades públicas e financiado pelo PRR.
Amália
29 Novembro 2024, 14h26

O large language model (LLM) português, de seu nome Amália, vai somar um investimento total de 5,5 milhões de euros e vai desenvolver-se nos próximos 18 meses, com o modelo a ter várias fases de implementação. O lançamento do Assistente Multimodal Automático de Linguagem com Inteligência Artificial (Amália) será efetivado até março do próximo ano, numa versão beta.

Luís Montenegro tinha revelado a criação de um LLM português – apelidado como ‘ChatGPT’ português ainda antes de se saber o nome – no palco principal da Web Summit, a 11 de novembro.

Aos 5,5 milhões de euros acresce “o vasto investimento já realizado em infraestrutura de computação, projetos de desenvolvimento e recursos humanos especializados que contribuirão em grande medida para o desenvolvimento do LLM”, lê-se em comunicado conjunto do Ministério da Juventude e Modernização e do Ministério da Educação, Ciência e Inovação. 

Nesta comunicado, os dois gabinetes adiantam que o financiamento será assegurado pelo Plano de Recuperação e Resiliência e “desenvolvido inteiramente por entidades públicas”, sendo que o mesmo financiamento se destinará exclusivamente às entidades envolvidas no desenvolvimento do Amália.

Este LLM de língua portuguesa reforça um dos objetivos do Governo de Luís Montenegro em colocar a tecnologia ao serviço das empresas, do Estado e dos cidadãos. A visão do Executivo é relativamente simples, embora desafiante: posicionar o Estado como um acelerador e impulsionador do ecossistema de investigação e inovação no âmbito da Inteligência Artificial.

O Amália surge então como a primeira iniciativa de posicionar Portugal nesse ângulo, estando inserida na Agenda Nacional de Inteligência Artificial, que só estará terminada enquanto versão multimodal no segundo trimestre de 2026. Resumidamente, a iniciativa vai contribuir para preservar a “soberania nacional, distinguir as diferentes variantes da língua portuguesa e reconhecer elementos da cultura e história de Portugal”, além de “permitir o controlo dos dados utilizados para a sua aprendizagem e assegurar condições de armazenamento e utilização de dados sensíveis, como é o caso da maioria dos dados da Administração Pública”.

Que entidades públicas vão estar dentro da iniciativa?

A execução operacional vai ser liderada pela Agência para a Modernização Administrativa, responsabilizando-se por toda a gestão da iniciativa e assegurar as condições necessárias para a futura disseminação do Amália por todos os potenciais utilizadores.

A Fundação para a Ciência e Tecnologia será a responsável por coordenar, junto dos centros de investigação, o treino e desenvolvimento do LLM, assegurar a infraestrutura necessária para o treino e alojamento do LLM, e também pelo tratamento e curadoria dos dados utilizados para esse treino e desenvolvimento.

Todo o treino e desenvolvimento do Amália será executado pelo consórcio liderado pelos centros de investigação Nova Lincs da Universidade Nova de Lisboa, Instituto de Telecomunicações e Instituto Superior Técnico. Ao consórcio podem ainda juntar-se outros centros de investigação nacionais com mérito reconhecido no âmbito da Inteligência Artificial.

As tutelas indicam que o desenvolvimento do Amália visa “aproveitar sinergias de projetos e investimentos já realizados, nomeadamente os projetos de desenvolvimento do EuroLLM no Instituto de Telecomunicações e Instituto Superior Técnico, e do GlórIA e v-GlórIA no Nova Lincsque utilizam a infraestrutura europeia da entidade europeia de computação de alta-performance EuroHPC, e que no caso do GlórIA e v-GlórIA já estão treinados em português de Portugal, o projeto de curadoria dos dados do Arquivo.pt, que está a ser realizado pela FCT, I.P., e o investimento realizado pelo Governo em infraestrutura de computação de alta-performance do ‘Deucalion’ e ‘Mare Nostrum 5′”.

O Governo adianta que será formado um Comité de Acompanhamento Especializado, constituído por peritos em Inteligência Artificial, como o Centro para a IA Responsável, que será presidido por uma personalidade de reconhecido mérito na área. É este grupo que ficará responsável por assegurar as melhores práticas de desenvolvimento do Amália, cumprimento dos princípios éticos e de segurança e aconselhar sobre o potencial de aplicações do modelo nos diversos setores de atividade.

Como é feita a aplicabilidade de Amália?

Como já referido, o processo de criação e desenvolvimento do Amália será feito ao longo de 18 meses, onde serão acrescentas funcionalidades mediante as atualizações.

Até ao final do primeiro trimestre do próximo ano deverá ser disponibilizada uma versão beta, com a versão base do Amália a chegar até ao fim do terceiro trimestre de 2025. Por sua vez, a versão final e multimodal (que está em permanente atualização) chegará no final do segundo trimestre de 2026.

De acordo com o Governo, o Amália será criado, numa primeira fase, com base no desenvolvimento do EuroLLM, GlórIA e v-Glóriam sendo capaz de diferenciar as variantes da língua portuguesa. Sabe-se então que será treinado com dados do Arquivo.pt, previamente curados. A versão beta vai conseguir receber e interpretar instruções em formato de texto e responder com base no conhecimento adquirido, em texto escrito em português de Portugal.

Por sua vez, até ao fim do terceiro trimestre de 2025, serão curados novos dados sobre a língua, a cultura e história de Portugal. O Arquivo.pt continua a ser utilizado como fonte. A principal diferença entre a versão beta e base será o upgrade na geração de respostas fiáveis e precisas sobre as temáticas, além de conseguir como responder a questões com total segurança e sem risco para o utilizador. Nesta altura, o Amália já poderá ser integrado noutras aplicações externas e utilizar dados dessas fontes para gerar respostas de texto.

“Todas as versões desenvolvidas serão disponibilizadas de forma gratuita e em open source, para que seja utilizado por todos, incluindo Academia, centros de investigação, entidades públicas, empresas e cidadãos”, sustentam as tutelas. Além das versões do LLM, todos os dados que suportam o treino serão disponibilizados em dados abertos, criando assim uma infraestrutura nacional de Inteligência Artificial que potencia o ecossistema de inovação da Inteligência Artificial em Portugal.

Na sua versão multimodal, o Amália já vai conseguir interpretar vários formatos de dados, seja em texto, imagem ou vídeo.

A versão final do LLM vai diferenciar-se na interpretação e geração de texto de língua portuguesa, no conhecimento da literatura, cultura e história de Portugal. Ainda assim, o seu objetivo não será “responder a perguntas genéricas em que o foco é a realização de raciocínios ou cálculos complexos, havendo outros LLM no mercado com bom desempenho nessas tarefas”.

RELACIONADO
Copyright © Jornal Económico. Todos os direitos reservados.