Apple Lança Novos Modelos de Linguagem Abertos

ByVolnei Filho

maio 1, 2024 #Apple, #dispositivos móveis, #Inteligência Artificial, #linguagem aberta, #Machine Learning, #Modelos de Linguagem, #Open-Source, #OpenELM, #Processamento de Linguagem Natural, #Tecnologia de Ponta

Aqui está um artigo para um blog sobre os principais pontos discutidos nos trechos de transcrição do vídeo:

Em uma surpreendente mudança de rumo, a Apple anunciou quatro novos modelos de linguagem abertos, parte da família OpenELM. Esses modelos têm 270 milhões, 450 milhões, 1,1 bilhão e 3 bilhões de parâmetros, tornando-os relativamente grandes em comparação com outros modelos de linguagem.

Tamanho Importante para Dispositivos Moveis

O tamanho do modelo é crucial porque modelos menores podem ser usados em dispositivos com limitações de processamento, como smartphones. Atualmente, modelos de linguagem grandes como o GPT-4 requerem computação em nuvem, mas os modelos OpenELM da Apple visam habilitar a inferência no dispositivo. Isso é importante para aplicações como óculos inteligentes, onde o processamento em tempo real é necessário.

Uma Vitória para a Comunidade Open-Source

A decisão da Apple de open-sourcer os modelos e reconhecer os desenvolvedores contribuidores é vista como uma situação de vitória para ambos, a Apple e a comunidade open-source. Ao reconhecer as contribuições dos desenvolvedores, a Apple pode atrair talentos de ponta e fomentar a colaboração.

OpenELM: um Modelo de Linguagem Eficiente

O modelo OpenELM é um modelo de linguagem eficiente treinado em um conjunto de dados gigante de 1,8 trilhão de tokens. Embora possa responder a perguntas, não consegue responder a perguntas complexas. O modelo foi treinado utilizando a biblioteca Cornet, uma biblioteca de rede neural profunda semelhante ao PyTorch ou TensorFlow.

Desempenho do Modelo

O vídeo também apresenta o desempenho do modelo OpenELM em uma leaderboard, comparando diferentes versões do modelo. Conforme o tamanho do modelo aumenta, o desempenho médio também aumenta.

Comportamentos Emergentes

O vídeo também discute comportamentos emergentes em modelos de linguagem grandes, onde o modelo aprende a entender coisas que não eram pretendidas, como entender a semântica e o tom de uma sentença.

Download e Quantização

O modelo pode ser baixado do Hugging Face, e a quantização do modelo pode torná-lo mais rápido. O palestrante planeja criar um vídeo sobre como quantizar o modelo e rodá-lo em um computador local.

By Volnei Filho

Linguagem

Apple Lança Novos Modelos de Linguagem Abertos

ByVolnei Filho

By Volnei Filho

Related Post

Desenvolvendo Aplicativos de Modelos de Linguagem em 2024: Uma Visão Geral

A Importância de Aprender Um Segundo Idioma em Uma Era de Ferramentas de Tradução Avançadas

Desbloqueie o Poder dos Modelos de Línguagem com o Guidance Framework

Deixe um comentário Cancelar resposta

You missed

Conditional Access: A Política de Segurança Next-Gen para a Proteção de Dados em Ambientes Cloud

Proteção contra Riscos Internos: Como a Microsoft Entra e Microsoft Purview podem ajudar

Configurando Políticas de Acesso Condicional com Autenticação Multifator no Azure: Um Guia Prático

Configurando e Aplicando Políticas de Acesso Condicional no Azure AD: Um Guia para Segurança Avançada