Neste artigo, vamos discutir como extrair informações específicas de texto usando a biblioteca Core, construída em cima da Langchain. Vamos ver como essa técnica pode ser utilizada para extrair informações de empresas e ferramentas a partir de descrições de trabalho.

Extraindo Informações de Empresa e Ferramentas

Para começar, o orador importa os pacotes necessários, incluindo Core e um modelo de linguagem. Em seguida, cria um objeto Core com ID e descrição, especificando os atributos que deseja extrair, como informações de empresa e ferramentas.

O orador demonstra como criar uma cadeia de extração e passar o modelo de linguagem e o objeto Core. Em seguida, define um texto de exemplo e passa-o pela cadeia para extrair as informações desejadas. O resultado mostra que o modelo de linguagem conseguiu extrair corretamente as informações de empresa e ferramentas.

Além disso, o orador demonstra como extrair múltiplos campos de informação, como tipo de planta, cor e avaliação, a partir de um texto de exemplo. O modelo de linguagem é capaz de lidar com dados vazios e apenas extrai as informações relevantes.

Aplicação em Diversos Contextos

A técnica de extração de informações específicas pode ser aplicada em diversos contextos. Por exemplo, o orador demonstra como extrair informações de carros, como tipo de carro, cor e peças, a partir de descrições de carros. Além disso, também demonstra como aplicar essa técnica em uma aplicação de previsão de receita, que toma entradas de linguagem natural dos usuários e extrai informações específicas, como ano, métrica e quantidade.

Análise de Descrições de Trabalho

Finalmente, o orador demonstra como aplicar essa técnica para analisar descrições de trabalho e extrair tecnologias mencionadas nessas descrições. Ele usa a API pública do Greenhouse para recuperar listagens de trabalho da Okta e, em seguida, usa a biblioteca Beautiful Soup para parsear o conteúdo HTML das descrições de trabalho.

O orador cria um modelo de conversa usando GPT-4 e define um objeto Core para extrair ferramentas das descrições de trabalho. Ele fornece exemplos de ferramentas mencionadas nas descrições de trabalho, como NetSuite, Looker, Microsoft Excel, AWS e Splunk. Em seguida, o modelo é solicitado a extrair ferramentas das descrições de trabalho e retorna uma lista de ferramentas mencionadas.

Conclusão

Neste artigo, vimos como a técnica de extração de informações específicas pode ser usada para extrair informações valiosas de texto. Essa técnica pode ser aplicada em diversos contextos, como análise de descrições de trabalho, aplicação de previsão de receita e muito mais. Além disso, é importante considerar o custo quando se usa essa técnica, especialmente quando se trabalha com grandes conjuntos de dados.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *