IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?
apresentação do livro

Foi concluído recentemente o projeto “Aqua – O uso eficiente da água nos jardins da idade moderna”, um trabalho interdisciplinar que cruza as áreas da História da Ciência, a Engenharia Hidráulica e a Arquitetura Paisagista.

uma rapariga e um rapaz

Todos os anos a Faculdade atribui diplomas e prémios de mérito académico aos seus estudantes, com o apoio de várias entidades e empresas, que valorizam a missão da Faculdade e que passa por investigar, ensinar e estimular a transferência do conhecimento e da inovação e a abertura à sociedade civil.

Exoplaneta e núvens

A Agência Espacial Europeia validou o desenho dos instrumentos científicos da missão Ariel, que conta com a participação do Instituto de Astrofísica e Ciências do Espaço. A missão vai observar a composição química de mil planetas em órbita de outras estrelas, e transformar a compreensão sobre como se formam e evoluem os sistemas planetários.

foto de grupo

No passado dia 26 de julho o Tec Labs - Centro de Inovação recebeu a visita de uma comitiva de representantes da Assembleia Legislativa do Estado de Goiás, Brasil, com o objetivo de conhecer em profundidade o ecossistema de empreendedorismo e inovação nacional e os seus principais stakeholders.

árvores no campus da Faculdade

Ciências ULisboa vai implementar no ano letivo de 2023/2024 o projeto “Ciências em Harmonia”. Comprometida com o bem-estar da sua comunidade estudantil e a promoção de competências individuais e sociais dos seus estudantes, a Faculdade vai procurar dar resposta a uma preocupação: a do bem-estar no ensino superior, envolvendo toda a comunidade académica na celebração da diversidade e promoção de inclusão. As atividades têm início já em setembro e vão prolongar-se durante todo o ano letivo.

logotipo do CWTS

ranking de Leiden, que avalia a produção científica de instituições de ensino superior a nível mundial, posicionou a ULisboa na liderança da Península Ibérica, colocando-a na 28.ª posição na Europa e no 131.º lugar a nível mundial.

enguia

No dia 26 julho, pelas 16h00, decorrerá na Ciências ULisboa a sessão de encerramento do projeto “Livro Vermelho e Sistema Nacional de Informação dos Peixes Dulciaquícolas e Diádromos de Portugal Continental”. O novo Livro Vermelho revela que os peixes de água doce e migradores diádromos se encontram numa situação preocupante.

3 raparigas a apontarem para um ecrã num laboratório

Acontece este ano mais uma edição do “Ser Cientista”. A 8.ª edição do programa, que decorre entre os próximos dias 24 e 28 de julho, visa proporcionar aos alunos do ensino secundário uma aproximação à realidade da investigação científica, pela integração no dia-a-dia dos cientistas de diferentes áreas de Ciências.

António Costa, Elvira Fortunato e Salomé Pais

Salomé Pais foi galardoada com a Medalha de Mérito Científico 2023, durante o Encontro com a Ciência e a Tecnologia em Portugal, decorrido no início de julho em Aveiro. Para a professora catedrática aposentada do Departamento de Biologia Vegetal da Ciências ULisboa esta distinção “simboliza o reconhecimento de uma vida dedicada à ciência”.

imagem de divulgação da exposição Mirabilia

É hoje inaugurada a exposição Mirabilia “Coisas Admiráveis”, que decorre no âmbito das comemorações dos 10 anos da ULisboa e do Dia da Universidade de Lisboa. A exposição integra objetos “admiráveis” das 18 escolas da ULisboa, entre eles um telescópio utilizado por um equipa da Ciências ULisboa na campanha internacional de observação “Venus Twilight Experiment”.

costa maritima

Carlos Antunes, foi nomeado vogal de reconhecido mérito da Comissão de Domínio Público Marítimo, um órgão consultivo da Autoridade Marítima Nacional que estuda e emite pareceres sobre os assuntos relativos à utilização, manutenção e defesa do domínio público marítimo.

Šima Krtalić

Šima Krtalić, aluna de doutoramento da Ciências ULisboa, afiliada ao projeto Medea-Chart, ganhou recentemente a décima edição do prémio "Imago Mundi" 2023 da referida revista académica, destinado a homenagear o melhor artigo em História da Cartografia.

Várias pessoas num sala

Ciências ULisboa participou na 3.ª edição do roadshow EA-IDEIA - Estrutura de Acompanhamento da Investigação, Desenvolvimento, Experimentação e Inovação da Armada, organizado pela Marinha Portuguesa.

Pedro Machado

Pedro Machado, investigador do Instituto de Astrofísica e Ciências do Espaço (IA) e professor da Ciências ULisboa, foi homenageado pelo Grupo de Trabalho para a Nomenclatura de Pequenos Corpos (WGSBN) da União Astronómica Internacional (IAU), com a atribuição do seu nome a um asteroide, que tem quase três quilómetros de diâmetro e demora quatro anos e meio a dar uma volta ao Sol.

ave a voar em cima do mar

Um novo estudo internacional sobre a análise do risco de exposição ao plástico por aves marinhas identifica o Mediterrâneo como a região de maior risco a nível global. O artigo foi publicado na revista científica Nature Communications e conta com 18 cientistas portugueses, entre eles quatro investigadores da Ciências ULisboa.

foto dos tres finalistas

Filipa Rocha, estudante de doutoramento na Ciências ULisboa, alcançou o 2.º lugar do Prémio Jovens Inventores 2023, atribuído pelo Instituto Europeu de Patentes. O prémio corresponde a um valor pecuniário de dez mil euros. A cerimónia de entrega de prémios decorreu esta manhã, em Valência, Espanha.

fotografia de grupo

Foi assinado um protocolo de cooperação entre Ciências ULisboa, a FCiências.ID, o cE3c e a empresa dinamarquesa Copenhagen Infrastructure Partners, que visa a investigação e mitigação dos impactos da exploração eólica offshore ao largo da Figueira da Foz.

Logotipo da ACL

Cristina Branquinho e Isabel Trigo foram eleitas em 2023 respetivamente sócias correspondentes nacionais da Classe de Ciências -  Ciências Biológicas e Ciências da Terra e do Espaço – da Academia das Ciências de Lisboa (ACL).

O projeto EDUCOAST, promovido pelo Instituto Português do Mar e da Atmosfera, desenvolve programas educacionais para diversos níveis de ensino e para profissionais, na área das geociências costeiras e marinhas, tendo como base o trabalho de campo e as práticas experimentais.

Conceção artística do telescópio espacial Euclid no espaço

A missão espacial Euclid da Agência Espacial Europeia (ESA) irá penetrar nos últimos 10 mil milhões de anos de história do Universo para tentar compreender pela primeira vez o que está a acelerar a expansão do Universo. O lançamento do telescópio espacial Euclid está previsto para 1 de julho. O telescópio vai observar durante seis anos mais de um terço do céu. A participação portuguesa na missão Euclid é coordenada pelo Instituto de Astrofísica e Ciências do Espaço.

João Pedro e Vera no laboratório

Ciências ULisboa integrou recentemente o projeto “Autonomia 21”, um projeto da Associação Pais 21 cujo objetivo é integrar jovens com Trissomia 21 no mercado de trabalho. O dinamizador desta ideia na Faculdade foi Federico Herrera, professor do DQB e investigador do BioISI. No âmbito deste projeto, Ciências ULisboa recebeu dois jovens que estão neste momento a estagiar num dos laboratórios da Faculdade.

José Pedro Granadeiro e Rui Rebelo

A expedição Selvagens 50 organizada pelo Instituto das Florestas e Conservação da Natureza da Madeira reuniu cerca de 40 especialistas de diversas instituições, entre os quais se incluem os professores do Departamento de Biologia Animal da Ciências ULisboa, José Pedro Granadeiro (aves marinhas) e Rui Rebelo (répteis terrestres).

Conceção artística de um exoplaneta semelhante a Vénus, em órbita da sua estrela

Uma equipa de investigadores escolheu um planeta a 106 anos-luz, com 1,37 vezes o diâmetro da Terra, descoberto em 2022, para apresentar a primeira simulação a três dimensões do clima de um planeta de tipo rochoso com as características que atualmente conhecemos em Vénus.

Grupo de alunos e professores

A 9.ª edição da final nacional das Olimpíadas Portuguesas da Geologia decorreu nos dias 3 e 4 de junho, no Centro Ciência Viva de Estremoz / Pólo de Estremoz da Universidade de Évora, com a participação de 25 estudantes vindos de diversas regiões do País, incluindo uma delegação dos Açores (São Roque do Pico).

Rádão

O professor do DQB Ciências ULisboa e investigador do BioISI Ciências ULisboa é o primeiro autor de um novo artigo publicado no jornal Physical Chemistry – Chemical Physics da Royal Society of Chemistry, onde foram estudados diferentes compostos de rádon e xénon - dois gases nobres – e onde as suas propriedades energéticas e de ligação química foram analisadas.

Páginas