Here is a summarized article based on the provided video transcript:

A Apple recentemente lançou um modelo de linguagem aberto chamado Open ELM, disponível em quatro tamanhos: 0,2 bilhão, 0,4 bilhão, 1 bilhão e 3 bilhões de parâmetros. Esses modelos são considerados modelos de linguagem pequenos que podem ser executados em telefones móveis.

O Open ELM é capaz de superar outros modelos de linguagem pequenos, como o Phi 3 da Microsoft, segundo o papel de pesquisa. Além disso, o Open ELM pode ser executado localmente em um computador, sem a necessidade de uma placa gráfica.

Para utilizar o Open ELM, é necessário clonar o modelo do GitHub e instalar as bibliotecas necessárias, além de gerar tokens de acesso no HuggingFace.co. Em seguida, é possível criar uma interface de usuário usando Radio e o modelo de linguagem para gerar completions de texto.

O modelo OpenELM 3B instruct é utilizado em combinação com o tokenizer LLaMA 7B para criar uma interface de usuário que possibilita aos usuários inserir prompts e receber respostas geradas pelo modelo. Além disso, o modelo pode ser comparado com outros modelos, como o Five3 da Microsoft, para avaliar seu desempenho.

Em resumo, o Open ELM é um modelo de linguagem aberto e escalável que pode ser executado localmente em um computador, tornando-se uma opção atraente para desenvolvedores e pesquisadores que desejam explorar o potencial desses modelos.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *