Blog

Instrumento útil para simplificar a análise de dados PMML

Após construir o modelo preditivo, é muito importante manter mente que, em geral a análise de dados PMML será aplicada em um novo conjunto de informações.

Por exemplo: Ao se desenvolver um modelo de inadimplência, objetiva-se saber, não somente a propensão de inadimplência de cada cliente, na base de dados utilizada, mas também a propensão de inadimplência de um novo cliente que acabou de ser incluído na base de dados.

No entanto, este processo de aplicação em um novo conjunto de dados, pode chegar a demandar meses para ficar pronto. E se a opção for reprocessar todo o modelo incluindo o  novo conjunto de  informações, este processamento pode demandar inúmeras horas. E até mesmo onerar toda a infra-estrutura computacional.

Mas nós da HupData temos duas boas notícias:

Primeira Boa Nova: O uso da análise de dados PMML para fazer o Deployment (implantação).

Considerando o processo de aplicação e implantação de soluções de Analytics, o uso do PMML no KNIME, pode trazer contribuições extremamente relevantes:

Diagrama de dados PMML

As vantagens de usar o PMML são:

  • Reduz o tempo de processamento permitindo assim predições instantâneas em alguns casos;
  • Permite a utilização de “best of breed” ferramentas a fim de construir as melhores soluções possíveis;
  • Permite mais transparência e as melhores práticas de Analytics;
  • Possibilita que o cliente da solução de Analytics possa processar o modelo em qualquer software que interprete o PMML;
  • Facilita o controle de versionamento do modelo;

Segunda Boa Nova:  O Uso do KNIME para processar o PMML.

O KNIME (versão-free) possui  funcionalidades que permitem  gerar, ler e até mesmo manipular  modelos escritos em PMML.

Vejamos este exemplo:

Primeiro passo é processar o modelo e gerar o PMML.

Diagrama de dados PMML

Segunda etapa, carrega o arquivo PMML e aplica o modelo do novo conjunto de dados, gerando as propensões.

Diagrama de dados PMML

Os dados de origem e as propensões podem ser lidas e gravadas, respectivamente , em flat table, Excel ou Banco de dados (Oracle, MySQL ou Plataformas de Big Data).

 O processo de implantação de soluções analíticas ficam muito facilitadas com o KNIME & PMML.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *