Skip to main content

Consórcio PORTULAN CLARIN LVT

O consórcio PORTULAN CLARIN LVT integra a infraestrutura nacional PORTULAN CLARIN, dedicada à Ciência e Tecnologia da Linguagem, com o objetivo de apoiar a investigação, o desenvolvimento tecnológico e a inovação na língua portuguesa.

No âmbito do Programa Regional de Lisboa 2021–2027 (Lisboa 2030), foi aprovada a candidatura apresentada pela Academia das Ciências de Lisboa [LISBOA2030-FEDER-01316900], com financiamento do Fundo Europeu de Desenvolvimento Regional (FEDER), visando a expansão e o aperfeiçoamento desta infraestrutura estratégica.

A PORTULAN CLARIN integra o Roteiro Nacional de Infraestruturas de Investigação de Relevância Estratégica, promovido pela Fundação para a Ciência e a Tecnologia, e é parte da infraestrutura internacional CLARIN ERIC, incluída no roteiro ESFRI da União Europeia.

 

Consórcio

O consórcio PORTULAN CLARIN LVT é constituído pela Faculdade de Ciências da Universidade de Lisboa, pela Faculdade de Letras da Universidade de Lisboa e pela Academia das Ciências de Lisboa, cuja adesão recente reforça de forma decisiva as dimensões científica, linguística e lexicográfica da infraestrutura.

Esta colaboração representa uma aposta estratégica na preparação da língua portuguesa para os desafios da transformação digital e da inteligência artificial (IA), assegurando a sua sustentabilidade, competitividade e relevância no contexto científico e tecnológico internacional.

 

Objetivos

O projeto tem como principais objetivos:

  • Expandir e consolidar a infraestrutura PORTULAN CLARIN enquanto referência nacional e internacional;
  • Reforçar o apoio à investigação em ciência e tecnologia da linguagem;
  • Promover a aplicação da IA à língua portuguesa, respeitando a sua especificidade linguística e cultural;
  • Assegurar o acesso aberto aos resultados do projeto, em alinhamento com os princípios da ciência aberta.

 

Principais Atividades

A execução do projeto permitirá:

  • O desenvolvimento de novos serviços avançados de processamento de linguagem natural, incluindo soluções baseadas em IA generativa;
  • A ampliação e enriquecimento do repositório de dados linguísticos da infraestrutura, incorporando recursos inovadores que potenciam aplicações de IA à língua portuguesa;
  • A criação e disponibilização de corpora representativos e de elevada qualidade;
  • A integração de bases lexicais e recursos linguísticos em Grandes Modelos de Linguagem (LLM);
  • A oferta de serviços avançados, como chatbots heurísticos, sistemas de transcrição multimodal e ferramentas de apoio à investigação linguística.
  • O treino de modelos de linguagem para o português.

Durante o desenvolvimento do projeto, serão disponibilizadas novas versões dos modelos de linguagem generativa desenvolvidos para a língua portuguesa, bem como outros modelos de código aberto especialmente adaptados ao português.

Estas atualizações permitirão avanços significativos em áreas como a tradução automática, os sistemas de resposta a perguntas, a análise textual e a investigação linguística, contribuindo para o fortalecimento do ecossistema digital da língua portuguesa.

 

Impacto e Relevância

A participação da Academia das Ciências de Lisboa reafirma o seu compromisso com o desenvolvimento tecnológico da língua portuguesa, garantindo que esta evolua em consonância com os mais recentes avanços da IA.

Este projeto contribui para a promoção da cidadania digital dos falantes de português e para a afirmação da língua como um ativo geoestratégico de primeira importância. Paralelamente, promove a cooperação científica e a internacionalização, reforçando a presença do português no ecossistema global de IA e assegurando a sua relevância e competitividade em múltiplos setores científicos, educativos, culturais e económicos.

 

Equipa (coordenação)

António Branco (Faculdade de Ciências da Universidade de Lisboa)

Amália Mendes (Faculdade de Letras da Universidade de Lisboa)

Ana Salgado (Academia das Ciências de Lisboa)