Analytic PlatformAprendizagem de MáquinaKNIME

Por que usar a plataforma KNIME?

A plataforma KNIME Analytics é um software de código aberto para todas as suas necessidades de dados. É gratuito para download no site do KNIME e gratuito para usar. Ele contém todas as principais técnicas de data wrangling e aprendizado de máquina baseados em programação visual.

As implicações de ser de código aberto e de uso livre são auto-explicativas, reduzindo as dores de cabeça legais referente ao licenciamento e o impacto no orçamento do projeto. O impacto da programação visual pode exigir mais algumas palavras de explicação. 

1 – Plataforma de Programação Visual

A programação visual tornou-se bastante popular nos últimos tempos e tem como objetivo substituir, parcial ou completamente, a prática de codificação. Na programação visual, uma GUI (Graphical User Interface) direciona você por todas as etapas necessárias para criar um pipeline (fluxo de trabalho) de blocos dedicados (nós). 

Ou seja, cada nó implementa uma determinada tarefa; cada fluxo de trabalho de nós leva seus dados, desde o início até o final da jornada projetada. Um fluxo de trabalho substitui um script; um nó substitui uma ou mais linhas de script.

No KNIME Analytics Platform, os nós (nodes) são criados ao arrastar e soltar (ou clicar duas vezes) do Node Repository  para editor de fluxo de trabalho (workflows) na parte central do ambiente de trabalho. Assim, nó após nó, o pipeline é rapidamente construído, configurado, executado, inspecionado e documentado.

knime editor de workflows
Figura 1. Plataforma KNIME Analytics. 

A programação visual é um recurso essencial da Plataforma KNIME para prototipagem rápida. Isso torna a ferramenta muito fácil de usar.

Por isso, a produção de alguns protótipos experimentais diferentes, antes de decidir a direção final do projeto, é rápida e bastante direta. A facilidade de implementação libera tempo para pensar mais profundamente sobre possíveis alternativas teóricas para a solução atual.

2 – A Curva de Aprendizado

A programação visual também torna a curva de aprendizado muito mais rápida do que nas ferramentas baseadas em código.

Atualmente, Data Science é aplicado em quase todas as disciplinas, incluindo humanas, idiomas, ciências da vida, economia e outras áreas da sabedoria humana. Nem todos os cientistas são programadores especializados e nem todos têm tempo livre para se tornarem programadores especializados. 

Uma ferramenta baseada em GUI pode ser aprendida e aplicada em menos tempo que uma ferramenta baseada em código, liberando tempo e recursos preciosos para investigações mais importantes.

Com a Plataforma KNIME Analytics, em poucas semanas, você já é capaz de montar fluxos de trabalho bastante complexos para transformação de dados e para o treinamento de algoritmos de aprendizado de máquina.

Além disso, muitos recursos educacionais em toda a web e especialmente no site KNIME ajudam a acelerar ainda mais essa curva de aprendizado. A partir da página de APRENDIZAGEM genérica no site KNIME, você pode passar para cursos com um instrutor ou cursos totalmente individualizados, todos levando a uma possível certificação. 

Nós da Hupdata, somos o parceiro oficial do KNIME aqui no Brasil e pioneiros em oferecer o Programa de Certificação do KNIME. Fique atento as nossas redes sociais e se inscreva em futuros programas de certificação.

Outra maneira de ajudar os iniciantes é através do KNIME Hub. Com o KNIME Hub, introduzimos uma grande força da Plataforma KNIME Analytics: a Comunidade KNIME.

3 – Comunidade KNIME

O KNIME Hub é o lugar certo para começar, pois é a biblioteca pública da comunidade KNIME. Aqui, você pode compartilhar seus workflows e fazer o download de workflows de outros usuários do KNIME.

3 .1 – Como fazer Download de Workflows

Basta digitar as palavras-chave e você obterá uma lista de workflows , componentes, extensões e muito mais. 

Por exemplo, digite na caixa de pesquisa “basic” ou “beginner” e você obterá uma lista de workflows de exemplo que ilustram conceitos básicos. Digite “read file” e você obterá uma lista de workflows de exemplo que ilustram como ler arquivos CSV, arquivos .table, arquivos de excel, etc. 

Observe que um subconjunto desses workflows de exemplo é relatado no servidor EXAMPLES no KNIME Explorer painel no canto superior esquerdo do KNIME.

Depois de escolher o workflows mais interessantes para você, faça o download e abra-o em sua própria plataforma KNIME Analytics. Lá dentro você pode começar a adaptá-lo aos seus dados e às suas necessidades. 

Assim, seguindo a tendência popular da moda na programação – que está procurando por partes de código prontas para usar – você pode apenas baixar, reutilizar e readaptar workflows ou partes de workflows do KNIME Hub para o seu próprio problema.

Obviamente, você também pode compartilhar seu trabalho no KNIME Hub para o bem público. Para compartilhar seus workflows apenas os copie da sua área de trabalho local para a pasta My-KNIME-Hub/Public no painel KNIME Explorer no ambiente de trabalho KNIME.

knime hub worflows compartilhados
Figura 2. Lista resultante de fluxos de trabalho da pesquisa “arquivo de leitura” no KNIME Hub

Porém, a comunidade KNIME não para no KNIME Hub.

O Fórum KNIME é realmente muito ativo e tem bastante dicas e truques. Aqui, você pode fazer perguntas ou procurar respostas anteriores. A comunidade é muito ativa e é altamente provável que alguém já tenha feito sua pergunta.


E por fim, as contribuições da comunidade estão disponíveis como postagens no Blog KNIME , como livros na KNIME Press e como vídeos no canal de TV KNIME no YouTube.

4 – Por que usar KNIME? – Parte 2

No próximo artigo, apresentaremos a parte 2

Este artigo é uma livre tradução do artigo originalmente publicado por Rosaria Silipo em seu blog no Medium. Esse conteúdo faz parte do seu novo livro de Machine learning.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *