O repositório de clonagem de voz por IA sofreu recentemente uma série de atualizações importantes, melhorando a experiência do usuário e expandindo as funcionalidades do sistema. Entre as principais novidades, destacam-se:

* A atualização para Python 3.11, garantindo a continuidade do suporte ao repositório após o fim do suporte ao Python 3.9 em 2025;
* A criação de uma nova aba “Prepare Outra Língua” na interface web, que permite aos usuários preparar conjuntos de dados para treinar modelos em outras línguas de forma mais fácil;
* A implementação de tokenizadores para outras línguas, ampliando as possibilidades de uso do repositório;
* A atualização de dependências, incluindo Pydantic 2.6.4 e DeepSpeed 14;
* A correção de erros que ocorriam com a atualização para bibliotecas mais recentes;
* A implementação de um novo módulo de análise em Gradio;
* A adição de novas ferramentas de conjunto de dados, incluindo ferramentas de conjunto de dados Tortoise e Whisper.

Além disso, o palestrante demonstrou a nova aba “Prepare Outra Língua” na interface web, que fornece uma interface simples para que os usuários selecionem a fonte do conjunto de dados e preparem-no para uso no repositório de clonagem de voz por IA.

Embora haja muito trabalho a ser feito, o palestrante promete continuar a trabalhar no repositório e responder a comentários e problemas assim que as atualizações estiverem concluídas. Ele também agradece o apoio contínuo dos membros do canal.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *