O que é, o que faz e onde encontrar um Cientista de Dados?

13.06.2016

Muito tem se falado sobre os Cientistas de Dados, seus salários e a quantidade de palavras buscadas pelo Linkedin que estão relacionadas a este perfil. Os RHs de grandes empresas dizem que procuram, mas não encontram. Parecem até unicórnios que só existem em contos de fadas.

 

Será que é isso mesmo o que ocorre? Vamos tentar analisar alguns aspectos... 

 

Será que é necessário ser graduado em Matemática/Estatística ou ter um doutorado para ser um Cientista de Dados? Uma formação acadêmica de quatro anos a mais supera a experiência adquirida de quem vai direto para um ambiente empresarial? Existe uma diferença de mentalidade ou abordagem de alguém que tenha um mestrado/doutorado para alguém que não tem? A verdade é: poucos profissionais e pesquisadores têm a oportunidade de conhecer e aplicar profundamente todas as técnicas de Data Science disponíveis no mercado. E essa complexidade aumenta considerando a variedade de serviços, plataformas, produtos, linguagens e ferramentas relacionadas ao assunto. Dessa maneira, o que diferencia o profissional é a facilidade de aprendizado e a habilidade para se utilizar novas soluções para novos problemas.

 

O Cientista de Dados trabalha somente com dados não-estruturados? Ao contrário do que se diz por aí um Cientista de Dados não trabalha apenas com dados não-estruturados. Aliás, as melhores fontes de informações para negócios ainda são as estruturadas. O Cientista de Dados vai onde o dado está. Se os dados estiverem em 1 planilha, ele utiliza a planilha. Seria da mesma maneira se os dados estivessem em 200 planilhas ou em quaisquer outras fontes como arquivos texto, bancos SQL/NoSQL, serviços, páginas na Internet, etc. Ele primeiramente extrai, valida, prepara, filtra, analisa, integra e agrega os dados, para só depois aplicar os modelos estatísticos. É sabido que, em geral, 80% do tempo de trabalho de um Cientista de Dados está na preparação dos dados e somente 20% na aplicação/comparação/evolução dos modelos.

 

Onde encontrar um Cientista de Dados? Na verdade, este é um problema recorrente quando se trata de contratação de mão-de-obra altamente qualificada no Brasil. As empresas oferecem valores abaixo de mercado e não encontram profissionais que correspondam às suas propostas. Depois alegam que o profissional não existe. Será que estão procurando no lugar certo ou da maneira correta?

 

Finalmente, existem poucos profissionais que conhecem profundamente os processos, métricas e KPIs das área de negócios em que estão envolvidos. E no final isso é o que importa para se ser um bom Cientista de Dados. Trata-se de usar a Estatística como meio e não como fim, ou seja, como ferramenta para resolução de problemas. Outra solução para essa "escassez" seria facilitar a formação de equipes multidisciplinares integrando pessoas que entendam os objetivos de negócios e pessoas com habilidades para manipular grandes quantidades de dados.

 

Seja como for, as empresas estão começando a entrar em uma nova Revolução Industrial, que desta vez é baseada em Informações. Para ela um Cientista de Dados será indispensável.

 

 

Alguns artigos como referência:

 

Do you need a PhD to be a Data Scientist?

 

The real prerequisite for machine learning isn’t math, it’s data analysis
 

Data Scientist Demistified

 

Data Science: Beyond the Kaggle

 

Miriam Leitão comenta falta de mão de obra qualificada no Brasil. Obs: o comentário é de 2011 e mostra dados desse período, quando a economia do Brasil ainda possuía índices bons de empregabilidade. Entretanto, a análise continua relevante.

 

Update 20/06/2017: aqui uma sequência de apresentações de Hans Hosling, que ficou famoso por suas apresentações em TED Talks analisando desenvolvimento de países com uso de dados.
 

Please reload

Últimos Posts
Please reload

© 2016 by Prime

RSS Feed