Integrated Deployment é a nova funcionalidade apresentada pelo CEO Michael Berthold no KNIME Spring Summit de 2020. Ela faz parte da Versão 4.2 do KNIME, que facilita o deployment de modelos de ML e já está disponível para download desde 13 de julho de 2020.
1 – Treinamento e ‘Deployment’ – Duas Etapas para colocar um Modelo em Produção
Quem trabalha construindo modelos preditivos, independentemente da ferramenta que utiliza, sabe que colocar os modelos em produção é uma tarefa bem diferente da construção do modelo em si.
Os novos dados precisam ser acessados (muitas vezes em tempo real) e devem estar no exato formato dos dados utilizados no treinamento e calibração do modelo. Além disso, o arquivo onde o modelo foi gravado precisa ser disponibilizado para um algoritmo que leia o conteúdo do modelo e o aplique nos dados novos, gerando as predições desejadas.
Portanto, é necessário construir um fluxo analítico diferente daquele onde o modelo foi treinado.
1.1 E o trabalho não acaba aí…
A medida que o modelo vai sendo consumido em produção, as predições precisam ser monitoradas e, provavelmente, o modelo precisará ser otimizado em algum momento.
Para isso, é necessário retrabalhar o fluxo analítico onde o modelo foi construído, talvez incluindo alguma variável, talvez otimizando a parametrização, ou ainda realizando alguma outra modificação no fluxo original.
É nesse ponto que erros podem facilmente acontecer. As modificações no fluxo original precisam agora ser passadas para o fluxo que está em produção.
Esse processo é manual e depende da atenção do cientista de dados para que nenhuma alteração deixe de ser implementada no ambiente produtivo. Quem tem experiência com implementação de machine learning em produção conhece bem o tamanho do esforço para realizar esse processo sem falhas.
2 – KNIME: Facilitando o ‘deployment de Modelos de Machine Learning
No último Spring Summit do KNIME, o CEO Michael Berthold fez uma apresentação mostrando pela primeira vez a funcionalidade de Integrated Deployment do KNIME. Esta funcionalidade foi disponibilizada na última versão do KNIME Analytics Platform, lançada em 13 de julho de 2020.
A funcionalidade de Integrated Deployment permite que não apenas o modelo, mas todas as etapas associadas de preparação e pós-processamento de dados sejam identificadas em um workflow analítico do KNIME, e reutilizadas automaticamente em um outro workflow usado no ambiente produtivo, sem que alterações ou trabalho manual sejam necessários.
2.1 – Conclusão
Ou seja, usar o KNIME Integrated Deployment permite que o processo de criação e deploy de Modelos de Machine Learning possa ser replicado repetidamente com facilidade, para manter o desempenho de modelos em produção.
Para saber mais sobre essa funcionalidade, entre em contato conosco (11) 3280-6819 / (11) 99428-2105
Ou acesse link abaixo:
https://bit.ly/Integrated_Deployment
Autor: Roberto Caffaro, Data Analysis Leader at HupData