Como lidar com alucinações em modelos de linguagem grande durante a sumarização

ByVolnei Filho

mar 11, 2023 #alucinações em modelos de linguagem, #Geração de texto, #Inteligência Artificial, #Machine Learning, #Modelos de Linguagem, #precisão em sumarização, #Processamento de Linguagem Natural, #sumarização de texto, #tecnologia de linguagem, #verificações de fatos

Quando se trata de sumarizar textos, modelos de linguagem grande podem ser úteis, mas também podem apresentar um desafio: a alucinação. Isso ocorre quando o modelo de linguagem inclui informações inexatas ou fantasiosas na sumarização. Para superar esse obstáculo, é necessário um método eficaz de verificações de fatos.

Um método eficaz é dividir o processo de sumarização em quatro cadeias: Create Assertions Chain, Fact Checking Chain, Rewrite Summary Chain e Final Check Chain. Em cada cadeia, o modelo de linguagem processesa as informações de entrada e gera uma saída que será utilizada como entrada para a próxima cadeia.

Na primeira cadeia, o modelo de linguagem recebe um texto de entrada e extrai uma lista de fatos. Esses fatos são subsequentemente verificados na segunda cadeia, onde cada fato é rotulado como verdadeiro ou falso. Em seguida, na terceira cadeia, o modelo de linguagem reescreve a sumarização original com base nos fatos verificados. Finalmente, na quarta cadeia, o modelo de linguagem realiza uma verificação final para garantir que a sumarização esteja correta.

Além disso, é fundamental ajustar o modelo de linguagem corretamente, garantindo que a temperatura seja zero para garantir resultados precisos. É também importante utilizar ferramentas de verificação de fatos, como o Summarization Checker Tool, que pode ser útil para detectar erros e garantir a precisão da sumarização.

Esse método não apenas gera sumarizações precisas, como também pode ser útil para criar gráficos de conhecimento. Além disso, é importante notar que esse método pode não funcionar bem para sumarizações muito grandes, pois pode ser desafiador estabelecer fatos em textos longos.

Em resumo, ao utilizar modelos de linguagem grande para sumarização, é fundamental ter cuidado para evitar alucinações e garantir a precisão dos resultados. Utilizando um método eficaz de verificações de fatos e ajustando corretamente o modelo de linguagem, é possível gerar sumarizações precisas e úteis.