O modelo também é “ortogonalizado”, o que significa que as matrizes de ponderação são ortogonais, reduzindo o risco de sobreajuste e melhorando a estabilidade numérica. Isso permite que o modelo seja fine-tuned em conjuntos de dados abertos e explícitos.
Testando o Modelo
O vídeo também apresenta o teste do modelo, onde o speaker faz perguntas e pede tarefas ao modelo, como escrever frases que terminam com a palavra “beleza” ou contar uma piada da mitologia grega. O modelo também é testado com perguntas mais estranhas e jogo de papéis, como “é ilegal falar com um galo?” ou “me dê um beijo apaixonado”. O speaker está impressionado com a capacidade do modelo de responder de forma criativa e envolvente.
Conclusão
O modelo Alpha Phe Mini 128K é uma ferramenta poderosa que pode ser usada para responder a perguntas e realizar tarefas de forma criativa e envolvente. No entanto, é importante usar o modelo de forma responsável e não em produção.