O vídeo destaca a importância do monitoramento de dados e modelos em aprendizado de máquina, especialmente nos serviços de Machine Learning da Oracle. Os palestrantes, Miles Novotny e Sherry LaMonica, explicam que o monitoramento é crucial para abordar proativamente problemas antes que eles impactem negócios.

O vídeo começa apresentando o conceito de drift de dados, que se refere a mudanças graduais nos dados ao longo do tempo, e monitoramento de dados, que envolve rastrear dados para detectar o drift de dados. Além disso, é explicado como definir e medir o drift de dados comparando dados de base com novos dados.

A discussão continua com a demonstração de como utilizar endpoints REST para apoiar o monitoramento de dados e modelos. É abordado o conceito de drift de modelo, que é a degradação gradual da qualidade preditiva de um modelo ao longo do tempo, e a diferença entre drift de dados e drift de conceito.

O vídeo apresenta um exemplo real de um banco que usa aprendizado de máquina para pré-aprovar candidatos a empréstimos, destacando a importância do monitoramento de dados como pré-requisito para o monitoramento eficaz de modelos.

O vídeo realça a importância do monitoramento de dados e modelos, uma vez que o drift de modelo pode ocorrer devido ao drift de dados ou drift de conceito. O monitoramento de dados pode ajudar a identificar a causa raiz e garantir que o modelo mais eficaz esteja sempre em produção.

Além disso, o vídeo apresenta os serviços de Machine Learning da Oracle (OML), que estendem a funcionalidade do OML no Banco de Dados Autônomo. Os serviços OML suportam o deploy de modelo, gerenciamento de ciclo de vida, pontuação e classificação/regressão com modelos de terceiros em formato ONNX.

Requisição de Monitoramento de Dados

Para solicitar um trabalho de monitoramento de dados, é necessário enviar uma solicitação POST para o endpoint OML com um token obtido anteriormente. A solicitação tem duas partes: agendamento de trabalho e propriedades de trabalho. O agendamento de trabalho define datas de início e fim, frequência e número máximo de execuções. As propriedades de trabalho incluem nome do trabalho, tipo de trabalho (monitoramento de dados), nomes de dados de saída, definições de dados de base e novos dados, limiar de detecção de drift de dados, coluna de tempo, data de início e data de fim.

Demonstração com Postman

A vídeo apresenta uma demonstração de como criar um trabalho de monitoramento de modelo e trabalho de monitoramento de dados usando Postman, uma interface amigável para visualizar a saída em formato de tabela.

Sessão de Perguntas e Respostas

Os palestrantes respondem a perguntas da audiência, fornecendo informações adicionais sobre monitoramento de dados e modelos. Os tópicos discutidos incluem os resultados de uma sondagem, esclarecimentos sobre comandos curl e planos para suporte de UI para trabalhos de monitoramento no futuro.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *