Após construir o modelo preditivo, é muito importante manter mente que, em geral a análise de dados PMML será aplicada em um novo conjunto de informações.
Por exemplo: Ao se desenvolver um modelo de inadimplência, objetiva-se saber, não somente a propensão de inadimplência de cada cliente, na base de dados utilizada, mas também a propensão de inadimplência de um novo cliente que acabou de ser incluído na base de dados.
No entanto, este processo de aplicação em um novo conjunto de dados, pode chegar a demandar meses para ficar pronto. E se a opção for reprocessar todo o modelo incluindo o novo conjunto de informações, este processamento pode demandar inúmeras horas. E até mesmo onerar toda a infra-estrutura computacional.
Mas nós da HupData temos duas boas notícias:
Primeira Boa Nova: O uso da análise de dados PMML para fazer o Deployment (implantação).
Considerando o processo de aplicação e implantação de soluções de Analytics, o uso do PMML no KNIME, pode trazer contribuições extremamente relevantes:
As vantagens de usar o PMML são:
- Reduz o tempo de processamento permitindo assim predições instantâneas em alguns casos;
- Permite a utilização de “best of breed” ferramentas a fim de construir as melhores soluções possíveis;
- Permite mais transparência e as melhores práticas de Analytics;
- Possibilita que o cliente da solução de Analytics possa processar o modelo em qualquer software que interprete o PMML;
- Facilita o controle de versionamento do modelo;
Segunda Boa Nova: O Uso do KNIME para processar o PMML.
O KNIME (versão-free) possui funcionalidades que permitem gerar, ler e até mesmo manipular modelos escritos em PMML.
Vejamos este exemplo:
Primeiro passo é processar o modelo e gerar o PMML.
Segunda etapa, carrega o arquivo PMML e aplica o modelo do novo conjunto de dados, gerando as propensões.
Os dados de origem e as propensões podem ser lidas e gravadas, respectivamente , em flat table, Excel ou Banco de dados (Oracle, MySQL ou Plataformas de Big Data).
O processo de implantação de soluções analíticas ficam muito facilitadas com o KNIME & PMML.