O vídeo começa apresentando o conceito de drift de dados, que se refere a mudanças graduais nos dados ao longo do tempo, e monitoramento de dados, que envolve rastrear dados para detectar o drift de dados. Além disso, é explicado como definir e medir o drift de dados comparando dados de base com novos dados.
A discussão continua com a demonstração de como utilizar endpoints REST para apoiar o monitoramento de dados e modelos. É abordado o conceito de drift de modelo, que é a degradação gradual da qualidade preditiva de um modelo ao longo do tempo, e a diferença entre drift de dados e drift de conceito.
O vídeo apresenta um exemplo real de um banco que usa aprendizado de máquina para pré-aprovar candidatos a empréstimos, destacando a importância do monitoramento de dados como pré-requisito para o monitoramento eficaz de modelos.
O vídeo realça a importância do monitoramento de dados e modelos, uma vez que o drift de modelo pode ocorrer devido ao drift de dados ou drift de conceito. O monitoramento de dados pode ajudar a identificar a causa raiz e garantir que o modelo mais eficaz esteja sempre em produção.
Além disso, o vídeo apresenta os serviços de Machine Learning da Oracle (OML), que estendem a funcionalidade do OML no Banco de Dados Autônomo. Os serviços OML suportam o deploy de modelo, gerenciamento de ciclo de vida, pontuação e classificação/regressão com modelos de terceiros em formato ONNX.
Requisição de Monitoramento de Dados
Para solicitar um trabalho de monitoramento de dados, é necessário enviar uma solicitação POST para o endpoint OML com um token obtido anteriormente. A solicitação tem duas partes: agendamento de trabalho e propriedades de trabalho. O agendamento de trabalho define datas de início e fim, frequência e número máximo de execuções. As propriedades de trabalho incluem nome do trabalho, tipo de trabalho (monitoramento de dados), nomes de dados de saída, definições de dados de base e novos dados, limiar de detecção de drift de dados, coluna de tempo, data de início e data de fim.
Demonstração com Postman
A vídeo apresenta uma demonstração de como criar um trabalho de monitoramento de modelo e trabalho de monitoramento de dados usando Postman, uma interface amigável para visualizar a saída em formato de tabela.
Sessão de Perguntas e Respostas
Os palestrantes respondem a perguntas da audiência, fornecendo informações adicionais sobre monitoramento de dados e modelos. Os tópicos discutidos incluem os resultados de uma sondagem, esclarecimentos sobre comandos curl e planos para suporte de UI para trabalhos de monitoramento no futuro.