KNIME Business Hub
É uma plataforma completa de Ciência de Dados, que ajuda as empresas a colaborar, implantar e compartilhar tarefas de dados por toda a organização.
Saiba Mais

Nossas Redes Sociais

Facilitando o ‘deployment’ de Modelos de Machine Learning

Implantação Integrada

Integrated Deployment é a nova funcionalidade apresentada pelo CEO Michael Berthold no KNIME Spring Summit de 2020. Ela faz parte da Versão 4.2 do KNIME, que facilita o deployment de modelos de ML e já está disponível para download desde 13 de julho de 2020.

1 – Treinamento e ‘Deployment’ – Duas Etapas para colocar um Modelo em Produção

Quem trabalha construindo modelos preditivos, independentemente da ferramenta que utiliza, sabe que colocar os modelos em produção é uma tarefa bem diferente da construção do modelo em si.

Os novos dados precisam ser acessados (muitas vezes em tempo real) e devem estar no exato formato dos dados utilizados no treinamento e calibração do modelo. Além disso, o arquivo onde o modelo foi gravado precisa ser disponibilizado para um algoritmo que leia o conteúdo do modelo e o aplique nos dados novos, gerando as predições desejadas.

Portanto, é necessário construir um fluxo analítico diferente daquele onde o modelo foi treinado.

1.1 E o trabalho não acaba aí…

A medida que o modelo vai sendo consumido em produção, as predições precisam ser monitoradas e, provavelmente, o modelo precisará ser otimizado em algum momento.

Para isso, é necessário retrabalhar o fluxo analítico onde o modelo foi construído, talvez incluindo alguma variável, talvez otimizando a parametrização, ou ainda realizando alguma outra modificação no fluxo original.

É nesse ponto que erros podem facilmente acontecer. As modificações no fluxo original precisam agora ser passadas para o fluxo que está em produção.

Esse processo é manual e depende da atenção do cientista de dados para que nenhuma alteração deixe de ser implementada no ambiente produtivo. Quem tem experiência com implementação de machine learning em produção conhece bem o tamanho do esforço para realizar esse processo sem falhas.

2 – KNIME: Facilitando o ‘deployment de Modelos de Machine Learning

Criando Modelo Preditivo e Workflow de ‘Deployment’

No último Spring Summit do KNIME, o CEO Michael Berthold fez uma apresentação mostrando pela primeira vez a funcionalidade de Integrated Deployment do KNIME. Esta funcionalidade foi disponibilizada na última versão do KNIME Analytics Platform, lançada em 13 de julho de 2020.

A funcionalidade de Integrated Deployment permite que não apenas o modelo, mas todas as etapas associadas de preparação e pós-processamento de dados sejam identificadas em um workflow analítico do KNIME, e reutilizadas automaticamente em um outro workflow usado no ambiente produtivo, sem que alterações ou trabalho manual sejam necessários.

2.1 – Conclusão

Ou seja, usar o KNIME Integrated Deployment permite que o processo de criação e deploy de Modelos de Machine Learning possa ser replicado repetidamente com facilidade, para manter o desempenho de modelos em produção.

Para saber mais sobre essa funcionalidade, entre em contato conosco (11) 3280-6819 / (11) 99428-2105

Ou acesse link abaixo:

https://bit.ly/Integrated_Deployment

Autor: Roberto Caffaro, Data Analysis Leader at HupData