Consórcio PORTULAN CLARIN LVT
O consórcio PORTULAN CLARIN LVT integra a infraestrutura nacional PORTULAN CLARIN, dedicada à Ciência e Tecnologia da Linguagem, com o objetivo de apoiar a investigação, o desenvolvimento tecnológico e a inovação na língua portuguesa.
No âmbito do Programa Regional de Lisboa 2021–2027 (Lisboa 2030), foi aprovada a candidatura apresentada pela Academia das Ciências de Lisboa [LISBOA2030-FEDER-01316900], com financiamento do Fundo Europeu de Desenvolvimento Regional (FEDER), visando a expansão e o aperfeiçoamento desta infraestrutura estratégica.
A PORTULAN CLARIN integra o Roteiro Nacional de Infraestruturas de Investigação de Relevância Estratégica, promovido pela Fundação para a Ciência e a Tecnologia, e é parte da infraestrutura internacional CLARIN ERIC, incluída no roteiro ESFRI da União Europeia.
Consórcio
O consórcio PORTULAN CLARIN LVT é constituído pela Faculdade de Ciências da Universidade de Lisboa, pela Faculdade de Letras da Universidade de Lisboa e pela Academia das Ciências de Lisboa, cuja adesão recente reforça de forma decisiva as dimensões científica, linguística e lexicográfica da infraestrutura.
Esta colaboração representa uma aposta estratégica na preparação da língua portuguesa para os desafios da transformação digital e da inteligência artificial (IA), assegurando a sua sustentabilidade, competitividade e relevância no contexto científico e tecnológico internacional.
Objetivos
O projeto tem como principais objetivos:
- Expandir e consolidar a infraestrutura PORTULAN CLARIN enquanto referência nacional e internacional;
- Reforçar o apoio à investigação em ciência e tecnologia da linguagem;
- Promover a aplicação da IA à língua portuguesa, respeitando a sua especificidade linguística e cultural;
- Assegurar o acesso aberto aos resultados do projeto, em alinhamento com os princípios da ciência aberta.
Principais Atividades
A execução do projeto permitirá:
- O desenvolvimento de novos serviços avançados de processamento de linguagem natural, incluindo soluções baseadas em IA generativa;
- A ampliação e enriquecimento do repositório de dados linguísticos da infraestrutura, incorporando recursos inovadores que potenciam aplicações de IA à língua portuguesa;
- A criação e disponibilização de corpora representativos e de elevada qualidade;
- A integração de bases lexicais e recursos linguísticos em Grandes Modelos de Linguagem (LLM);
- A oferta de serviços avançados, como chatbots heurísticos, sistemas de transcrição multimodal e ferramentas de apoio à investigação linguística.
- O treino de modelos de linguagem para o português.
Durante o desenvolvimento do projeto, serão disponibilizadas novas versões dos modelos de linguagem generativa desenvolvidos para a língua portuguesa, bem como outros modelos de código aberto especialmente adaptados ao português.
Estas atualizações permitirão avanços significativos em áreas como a tradução automática, os sistemas de resposta a perguntas, a análise textual e a investigação linguística, contribuindo para o fortalecimento do ecossistema digital da língua portuguesa.
Impacto e Relevância
A participação da Academia das Ciências de Lisboa reafirma o seu compromisso com o desenvolvimento tecnológico da língua portuguesa, garantindo que esta evolua em consonância com os mais recentes avanços da IA.
Este projeto contribui para a promoção da cidadania digital dos falantes de português e para a afirmação da língua como um ativo geoestratégico de primeira importância. Paralelamente, promove a cooperação científica e a internacionalização, reforçando a presença do português no ecossistema global de IA e assegurando a sua relevância e competitividade em múltiplos setores científicos, educativos, culturais e económicos.
Equipa (coordenação)
António Branco (Faculdade de Ciências da Universidade de Lisboa)
Amália Mendes (Faculdade de Letras da Universidade de Lisboa)
Ana Salgado (Academia das Ciências de Lisboa)