Este artigo apresenta um guia passo a passo para criar um banco de dados vetorial gratuito com Quadrant, uma alternativa de código aberto ao Pinecone, e Langchain, uma biblioteca de processamento de linguagem natural. O tutorial mostra como configurar um cluster gratuito de 1 GB na plataforma de nuvem Quadrant e criar um armazenamento de vetores persistente.

Configurando o Cluster Quadrant

Para começar, é necessário criar uma conta na plataforma de nuvem Quadrant e configurar um cluster servidor na Europa dentro do plano de preços gratuito (1 GB de memória, 0,5 CPU virtual e 20 GB de espaço de armazenamento). Em seguida, é criada uma chave de API para conectar ao cluster.

Interagindo com o Cluster

Em seguida, é demonstrado como interagir com o cluster usando um cliente HTTP (como Postman ou Thunder) para testar o cluster. É enviada uma solicitação HTTP para a URL do cluster, incluindo a chave de API como um cabeçalho. Além disso, são demonstrados como criar novos vetores, armazenar e recuperar dados de uma coleção.

Arquitetura Quadrant e Script Python

A arquitetura Quadrant é explicada, incluindo clusters, coleções e pontos (vetores). Em seguida, é criado um script Python para interagir com o cluster Quadrant. É usado um objeto de cliente Quadrant para criar uma nova coleção no cluster.

Criando um Armazenamento de Vetores

Em seguida, é criado um objeto de armazenamento de vetores usando a classe `VectorStore` da Langchain. É definida uma variável de ambiente para a chave de API do OpenAI e criada uma nova chave de API no OpenAI. Em seguida, é adicionado texto ao armazenamento de vetores usando o método `addTexts()`.

Preparando Dados de Texto

Um função `getChunks` é definida para dividir uma string de texto grande em pedaços menores. É explicado como o overlap de chunk funciona, permitindo mais contexto em cada pedaço de texto. Em seguida, é usado o método `getChunks` para dividir uma história em pedaços e armazená-los em uma matriz. A matriz de pedaços de texto é impressa e os pedaços de texto são embutidos usando anexos do OpenAI e armazenados no armazenamento de vetores.

Usando Langchain e Streamlit

Por fim, é demonstrado como usar Langchain para conectar ao armazenamento de vetores e permitir interações de questionamento e resposta com as informações armazenadas. É criado um objeto QA, especificado o recuperador como o armazenamento de vetores, e é feita uma consulta ao banco de dados perguntando uma pergunta, que retorna a resposta correta. Além disso, é mostrado como usar essa funcionalidade em uma interface gráfica de usuário usando Streamlit, permitindo que os usuários ingressem perguntas e obtenham respostas do banco de dados remoto.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *