Aprendizagem de MáquinaCientista de DadosData Science

O que é preciso para ser um CIENTISTA DE DADOS de sucesso?

A ciência de dados é necessária para diferentes atividades, que exigem habilidades e conhecimentos cada vez mais sofisticados dos cientistas de dados. Para ser um cientista de dados de sucesso não basta ter apenas conhecimento teórico; é preciso ter experiência na aplicação da ciência de dados aos problemas do mundo real

Bons cientistas de dados são raros e isso não é novidade. Muitos programas educacionais estão surgindo para oferecer treinamentos e atender a demanda. As universidades presenciais, online e empresas estão criando departamentos, centros de ciência de dados e certificações de ciência de dados em apenas algumas semanas ou meses.

Mas, qual é a abordagem correta para ganhar suas credenciais e se chamar de cientista de dados de sucesso?

Conhecimento Teórico e Prático

Teoria ou Prática

Nos últimos anos, esperava-se que uma solução única e simples pudesse permitir que todos se tornassem cientistas de dados – se lhes dessem as ferramentas certas. Mas, semelhante a um médico que precisa saber como o corpo humano funciona, um cientista de dados precisa entender os modelos e algoritmos com solidez, para poder fazer escolhas de qual método deve ser utilizado em cada situação.

Afinal, estamos falando de cientistas de dados e, não apenas, de usuários de “caixas-pretas” projetadas por cientistas de dados de sucesso. Um médico não se transforma em médico, dizendo-nos qual medicamento tomar.

A questão é – uma educação teórica é suficiente? Minha resposta aqui é NÃO. A ciência de dados tem tudo a ver com conhecer a ferramenta, assim como ter a experiência em aplicá-la aos problemas do mundo real. Ter um certo ‘pressentimento’ quando os resultados são suspeitosamente positivos (ou estranhos). Geralmente, são coisas tão simples quanto questionar uma precisão de 98% em um modelo de churn.

Para se tornar um cientista de dados de sucesso é necessário conhecer a teoria e ter a experiência necessária para saber como chegar e quando confiar em seus resultados. A grande questão é: podemos ensinar ‘experiência do mundo real durante nossos cursos?

Cientista de Dados de Sucesso precisam ter experiência do mundo real

Praticar é treino suficiente?

Muitos aspirantes a cientistas de dados afirmam ter adquirido essa experiência do mundo real ao trabalhar em desafios de análise de dados online – Kaggle ou outros.

Mas, isso é parcialmente verdadeiro, porque esses desafios se concentram em uma parte pequena, importante, mas bastante estática do trabalho. O KNIME, por exemplo, pode ser usado para criar um conjunto de dados artificiais parecidos no mundo real, além de analisá-los.

Mas isso é como aprender a dirigir em um playground; não o prepara para dirigir no centro de São Paulo. De alguma forma, não podemos nos preparar para a vida real na privacidade de nossa casa ou da sala de aula.

Mas afinal, o que um cientista de dados realmente faz?

Muitos artigos já abordaram a disseminação horizontal de atividades, envolvendo desde o fornecimento de dados, a combinação e a transformação até a criação de aplicativos analíticos interativos ou a implantação de modelos (sem ainda mencionar o monitoramento e a atualização contínua desses modelos de produção). 

Muitos profissionais se concentram apenas na parte da modelagem; mas esse não é o único problema.

Vamos considerar também a propagação vertical de tarefas: por que precisamos de ciência de dados?

Tarefas Básicas dos Cientistas de Dados

1 – Tarefas Básicas

Vamos considerar o cenário em que a pergunta a ser respondida já está bem estabelecida. Desta forma, o projeto apenas apoiará ou confirmará o que as partes interessadas da empresa sabem e colocam esse conhecimento em prática.

O cientista deve ter condições de construir e otimizar um modelo para responder as pergunta(s) do projeto e fornecer melhores resultados. Para isso, ele precisa entender os fundamentos dos modelos, algoritmos e assim poder ajustar os muitos pequenos botões para otimizar o desempenho destes modelos.

Exemplos disso são as tarefas como prever o churn (rotatividade) de clientes.

Tarefas Intermediárias dos Cientistas de Dados

2 – Tarefas Intermediárias

O cliente (a empresa) sabe o que deseja otimizar, mas não possui uma formulação clara dos problemas e, com muita frequência, não possui os dados corretos.

Aqui, o cientista de dados precisa ter experiência na comunicação com as partes interessadas e especialistas em domínio para identificar os dados a serem coletados, trabalhar estes dados, treinar os modelos certos para fornecer as respostas para a pergunta certa.

Tarefas Avançadas dos Cientistas de Dados

3- Tarefas Avançadas

O objetivo é criar novos insights que acionam novas atividades analíticas e poderão mudar completamente a maneira como as coisas são feitas no futuro. O trabalho do cientista de dados é apoiar esse tipo de geração exploratória de hipóteses.

Para esse tipo de atividade, o cientista de dados precisa ter experiência em lidar com perguntas abertas e a capacidade de interagir rapidamente com diferentes tipos de métodos e modelos de análise. Requer uma capacidade de ir além de um projeto existente e requer  aprendizado de experiências passadas.

Muitas vezes nesse cenário, o tipo de informações geradas ontem não é interessante hoje, porque as informações anteriores avançaram e mudaram o conhecimento do cientista de dados e do especialista em domínio!

Para onde?

A ciência de dados assim como a ciência da computação, requer uma mistura de teoria e prática. Semelhante à maneira como agora executamos projetos de software como parte da maioria dos currículos de ciências da computação, devemos adicionar projetos práticos aos currículos de ciências de dados. Porém, como programadores bem-sucedidos, cientistas de dados bem-sucedidos exigirão anos de experiência prática no mundo real, antes de serem capazes de resolver problemas reais de forma independente.

Para algumas tarefas mais fáceis, podemos colocar cientistas júnior de dados para trabalhar até automatizar (partes do) processo.

Mas, para a disciplina realmente interessante da ciência de dados – aquela que nos ajuda a aprimorar nosso conhecimento e compreensão de como as coisas funcionam -, precisamos de verdadeiros cientistas de dados, mestres, com profundo entendimento teórico, muita experiência e capacidade de pensar além do óbvio.

Artigo original:https://www.knime.com/blog/what-does-it-take-to-be-a-successful-data-scientist

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *