IA generativa para o português cresce com modelos Albertina e Gervásio

Ecossistema, líder mundial de grandes modelos de linguagem abertos para a língua portuguesa, é coordenado por António Branco, professor da Ciências ULisboa

robot e criança

A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B

Imagem cedida por AB

À família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família desenvolvido até ao momento, com 1.500 milhões de parâmetros, juntando-se assim aos outros modelos já existentes, com 100 e 900 milhões de parâmetros. Por sua vez, à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros.O Gervásio 7B foi desenvolvido pelo NLX-Grupo da Fala e da Linguagem Natural da Ciências ULisboa. Para uma descrição detalhada, consulte a respetiva publicação: Santos et al., 2024, “Advancing Generative AI for Portuguese with Open Decoder Gervásio PT*”, 3rd Annual SIGUL Meeting, LREC-COLING2024. Para o desenvolvimento do Albertina 1.5B, com o Grupo NLX da Ciências ULisboa, colaborou uma equipa da Faculdade de Engenharia da Universidade do Porto. A respetiva descrição encontra-se em: Santos et al., 2024, “Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family”, 3rd Annual SIGUL Meeting, LREC.

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio. A família Albertina (codificadores) foi aumentada com o novo Albertina 1.5B, e a família Gervásio (descodificadores) com o Gervásio 7B.

“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial“, diz o seu coordenador, António Branco, professor do Departamento de Informática da Ciências ULisboa, acrescentando que “estas classes de modelos estão na base de toda a gama de aplicações de IA Generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Este ecossistema é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados. São de código aberto, gratuitos e distribuídos em acesso aberto sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos.

Recorde-se que o primeiro modelo Albertina foi disponibilizado em maio de 2023, no que constituiu um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes, de Portugal e do Brasil, e disponibilizado para investigadores, em organizações públicas e privadas, grandes e pequenas, de todos os setores económicos.

O desenvolvimento deste ecossistema tem tido o apoio da PORTULAN CLARIN Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem, da Agenda do PRR Accelerat.ai, e da FCCN/FCT, e vai continuar a crescer com mais e melhores modelos.

“Como exemplo, entre muitos outros, da reutilização destes modelos abertos para todo o tipo de finalidades, e por isso do seu importantíssimo efeito multiplicador e democratizador da IA, há a assinalar o recente desenvolvimento por uma start-up do MediAlbertina, para a IA generativa aplicada à medicina em língua portuguesa, que foi possível porque o Albertina já existia para servir de base”, diz  António Branco.

Gabinete de Jornalismo da DCI Ciências ULisboa com Gonçalo Boffil
noticias@ciencias.ulisboa.pt
Já conhece o Albertina PT?

CIÊNCIAS esteve presente nesta edição, com a participação dos docentes do Departamento de Física: Alexandre Cabral, no painel de abertura “À conversa sobre carreiras espaciais” e

Semana Internacional da Compostagem

Uma das transformações necessárias às entidades que querem progredir pelo caminho da sustentabilidade é fecharem os seus ciclos de materiais, nomeadamente o orgânico.

A VicenTuna - Tuna da Faculdade de Ciências da Universidade de Lisboa - completou 30 anos em janeiro de 2024. Para comemorar, realizou no dia 30 de abril de 2024, a Festa da Primavera, um espetáculo de música e divertimento dedicado à comunidade de CIÊNCIAS e ao público em geral.

Celebrações dos 50 anos do 25 de abril de 1974 da Academia das Ciências de Lisboa

A 9 de maio realiza-se a segunda de duas jornadas de debate académico e científico organizadas pela Academia das Ciências de Lisboa, que tem por objetivo ‘analisar e discutir a evolução do panorama científico português de forma prospetiv

Lançamento do projeto Barrocal-Cave marca um novo capítulo na Conservação da Biodiversidade em Portugal

O prestigiado Palácio Gama Lobo foi o cenário escolhido para o lançamento do projeto Barrocal-Cave, financiado pelo Prémio Fundação Belmiro de Azevedo 2023.

No passado dia 10 de abril, tivemos a honra de receber um grupo de estudantes e dois professores da Universidade de Leiden, na Holanda. Com um total de 40 estudantes, todos da área das bio farmacêuticas, a visita prometia ser entusiástica.

Miguel Pinto

No dia 29 de abril, Miguel Pinto visitou a Escola Básica Professora Aida Vieira, no Bairro Padre Cruz em Lisboa, para realizar oficinas de divulgação científica e atividades didáticas.

Modelo do espectrógrafo MOONS

Os investigadores do Instituto de Astrofísica e Ciências do Espaço (IA) de CIÊNCIAS ganharam o prémio vector de ouro de 2024 pelo seu espectrógrafo MOONS, um espectrógrafo multiobjectos no infravermelho próximo de alta resolução.

Fotografia de alguns dos oradores

O que é a sustentabilidade? Como podemos agir a nível local, procurando um impacto global? Estas e muitas outras questões marcaram a segunda edição da Semana da Sustentabilidade CIÊNCIAS, entre 15 e 19 de abril de 2024.

Grande Auditório durante a celebração do 113.º aniversário de CIÊNCIAS

Mais de 500 pessoas assistiram no Grande Auditório à celebração do 113.º aniversário de CIÊNCIAS, na passada terça-feira, 23 de abril, numa cerimónia marcada por distinções, homenagens e um balanço dos últimos meses, com os olhos postos no futuro. 

Buracos negros Gaia

Um grupo de cientistas descobriu um grande buraco negro, com uma massa quase 33 vezes superior à massa do Sol, escondido na constelação de Aquila, a menos de 2000 anos-luz da Terra, ao analisar a grande quantidade de dados da missão Gaia da ESA.

Alunos com mãoes no ar num sala de aula

É possível brincar com a Matemática e prova disso foram as várias atividades que se realizaram na Faculdade nos dias 13 e 14 de março de 2024. Março foi um mês dedicado a esta ciência, motor da sociedade. Leia a opinião de quem participou nestas atividades e ainda nas Jornadas de Matemática.

robot e criança

Ecossistema de grandes modelos de linguagem de IA Generativa para a língua portuguesa foi expandido com novas versões dos modelos Albertina e Gervásio.

Participantes da 1.ª edição do JAB

A 1ª edição do JAB, um evento inovador destinado a jovens empreendedores, organizado pela JUST - Júnior Iniciativa de Ciências ocorreu nos dias 22 e 23 de março passado e teve como foco a Educação de Qualidade, quarto Objetivo de Desenvolvimento Sustentável.

Pessoas

Uma comitiva da Shanghai Ocean University (SHOU), cuja origem remonta à Escola de Pesca da Província de Jiangsu, fundada em 1912, visitou Ciências ULisboa no passado dia 25 de março. Wang Hongzhou, presidente do Conselho da universidade chinesa, elogiou o avanço da investigação realizada na Ciências ULisboa, destacando as boas práticas de gestão, interdisciplinaridade e foco na missão. Durante a ocasião, Luís Carriço, diretor da Ciências ULisboa, reconheceu a importância das relações bilaterais com a China.

Alunos dinarmarqueses junto à tabela periódica

Um grupo de 25 estudantes do ensino secundário do Egedal Gymnasium & HF, da Dinamarca, visitou a Ciências ULisboa no passado dia 21 de março.

Sala com pessoas

A “Sessão de demonstração do serviço CONNECT – Caso de uso #1, Estuário do Tejo” ocorreu no passado dia 13 de março.

Várias pessoas no stand da Fcauldade Futurália

Como já vem sendo tradição, a Ciências ULisboa esteve presente na 15.ª edição da Futurália, a maior feira de educação, formação e empregabilidade do país, que se realizou entre 20 e 23 de março, na FIL - Feira Internacional de Lisboa e que juntou muitos visitantes, especialmente candidatos ao ensino superior. A Direção da Ciências ULisboa agradece aos mais de 200 estudantes voluntários e aos cerca de 70 professores, investigadores, entre outros profissionais que se vestiram de azul para esclarecerem as dúvidas dos candidatos ao ensino superior, lançando ainda o convite para visitarem a Faculdade no próximo Dia Aberto, que se realiza no próximo dia 8 de maio e cujas inscrições podem ser feitas aqui. Até lá!

Imagem do Miguel Pires durante a competição ocorrida em videoconferência

Miguel Pires, estudante da licenciatura de Engenharia Geoespacial da Ciências ULisboa, venceu a edição portuguesa do Esri Young Scholars Award e que lhe dá a oportunidade de apresentar o seu projeto Dashboard CicLisboa no maior evento de Sistemas de Informação Geográfica a nível mundial - o Esri User Conference e a Education Summit -, ambos a decorrer no próximo mês de julho, em San Diego, na Califórnia (EUA).

Pessoa numa praia com neve

A missão da Ciências ULisboa é criar, transmitir e difundir conhecimento científico e tecnológico, promovendo uma cultura de aprendizagem permanente, valorizando o pensamento crítico e a autonomia intelectual. Nesta “casa“ todos os dias alunos, professores, investigadores, entre outros profissionais encontram motivos para cuidar do nosso planeta. Bem hajam!

Dia Internacional das Florestas 2024

Leia o testemunho de António Vaz Pato, estudante do mestrado de Biologia da Conservação e guardião da HortaFCUL, a propósito desta efeméride e assista ao vídeo que preparamos para celebrar esta data especial nas nossas redes sociais: YouTube, Facebook, LinkedIn e Instagram.

céu

João Pires Ribeiro, professor aposentado do Departamento de Física da Ciências ULisboa, faleceu dia 18 de março, em Lisboa, aos 83 anos. A Ciências ULisboa lamenta o triste acontecimento e apresenta as condolências aos seus familiares, amigos, colegas e antigos estudantes.

Tiago Oliveira, Ricardo Mendes e Alysson Bessani

A Vawlt, uma spin-off da Ciências ULisboa, conseguiu angariar 2,15 milhões de euros e três novos investidores - a Lince Capital, a Basinghall e a Beta Capital - para impulsionar ainda mais a inovação do seu produto, elevando o investimento total acumulado para os três milhões euros.

imagem da Reitoria da ULisboa

A ULisboa é uma vez mais a universidade portuguesa melhor classificada a nível nacional no SCImago Institutions Rankings (SIR), tendo subido este ano 25 posições, apesar deste ano terem sido analisadas mais 229 universidades. A ULisboa anunciou esta semana que está entre as 150 melhores instituições do mundo e a nível nacional lidera 12 áreas e 22 subáreas científicas, posicionando-se em 2.º lugar em quatro áreas e 21 subáreas.

Imagem do Cercal num portátil com pessoas desfocadas

A Ciências ULisboa já tem os primeiros resultados do trabalho científico que tem vindo a desenvolver na área onde vai ser implementada a central fotovoltaica do Cercal, em Santiago do Cacém, um estudo considerado pioneiro pela integração de tantas componentes biológicas e pelo detalhe espacial que foi usado.

Páginas