O que é, o que faz e onde encontrar um Cientista de Dados?


Muito tem se falado sobre os Cientistas de Dados, seus salários e a quantidade de palavras buscadas pelo Linkedin que estão relacionadas a este perfil. Os RHs de grandes empresas dizem que procuram, mas não encontram. Parecem até unicórnios que só existem em contos de fadas.

Será que é isso mesmo o que ocorre? Vamos tentar analisar alguns aspectos...

Será que é necessário ser graduado em Matemática/Estatística ou ter um doutorado para ser um Cientista de Dados? Uma formação acadêmica de quatro anos a mais supera a experiência adquirida de quem vai direto para um ambiente empresarial? Existe uma diferença de mentalidade ou abordagem de alguém que tenha um mestrado/doutorado para alguém que não tem? A verdade é: poucos profissionais e pesquisadores têm a oportunidade de conhecer e aplicar profundamente todas as técnicas de Data Science disponíveis no mercado. E essa complexidade aumenta considerando a variedade de serviços, plataformas, produtos, linguagens e ferramentas relacionadas ao assunto. Dessa maneira, o que diferencia o profissional é a facilidade de aprendizado e a habilidade para se utilizar novas soluções para novos problemas.

O Cientista de Dados trabalha somente com dados não-estruturados? Ao contrário do que se diz por aí um Cientista de Dados não trabalha apenas com dados não-estruturados. Aliás, as melhores fontes de informações para negócios ainda são as estruturadas. O Cientista de Dados vai onde o dado está. Se os dados estiverem em 1 planilha, ele utiliza a planilha. Seria da mesma maneira se os dados estivessem em 200 planilhas ou em quaisquer outras fontes como arquivos texto, bancos SQL/NoSQL, serviços, páginas na Internet, etc. Ele primeiramente extrai, valida, prepara, filtra, analisa, integra e agrega os dados, para só depois aplicar os modelos estatísticos. É sabido que, em geral, 80% do tempo de trabalho de um Cientista de Dados está na preparação dos dados e somente 20% na aplicação/comparação/evolução dos modelos.

Onde encontrar um Cientista de Dados? Na verdade, este é um problema recorrente quando se trata de contratação de mão-de-obra altamente qualificada no Brasil. As empresas oferecem valores abaixo de mercado e não encontram profissionais que correspondam às suas propostas. Depois alegam que o profissional não existe. Será que estão procurando no lugar certo ou da maneira correta?

Finalmente, existem poucos profissionais que conhecem profundamente os processos, métricas e KPIs das área de negócios em que estão envolvidos. E no final isso é o que importa para se ser um bom Cientista de Dados. Trata-se de usar a Estatística como meio e não como fim, ou seja, como ferramenta para resolução de problemas. Outra solução para essa "escassez" seria facilitar a formação de equipes multidisciplinares integrando pessoas que entendam os objetivos de negócios e pessoas com habilidades para manipular grandes quantidades de dados.

Seja como for, as empresas estão começando a entrar em uma nova Revolução Industrial, que desta vez é baseada em Informações. Para ela um Cientista de Dados será indispensável.

Alguns artigos como referência:

Do you need a PhD to be a Data Scientist?

The real prerequisite for machine learning isn’t math, it’s data analysis

Data Scientist Demistified

Data Science: Beyond the Kaggle

Miriam Leitão comenta falta de mão de obra qualificada no Brasil. Obs: o comentário é de 2011 e mostra dados desse período, quando a economia do Brasil ainda possuía índices bons de empregabilidade. Entretanto, a análise continua relevante.

Update 20/06/2017: aqui uma sequência de apresentações de Hans Hosling, que ficou famoso por suas apresentações em TED Talks analisando desenvolvimento de países com uso de dados.

#bigdata #datascience #cientistadedados #machinelearning #businessintelligence #analytics #emprego #projetos #serviços #consultoria

Últimos Posts

© 2016 by Prime

RSS Feed