Pensando sobre a habilidade de programação necessária para um cientista de dados, de acordo com a
plataforma de cursos on-line Udacity (2018), é correto afirmar que:
Não importa qual é o tipo de empresa ou papel em questão: é esperado que você saiba usar ferramentas como linguagens
de programação estatística, como R ou Python, e uma linguagem de manipulação de dados, como SQL.
Uma boa base de estatística é fundamental para um profissional cientista de dados, que precisa ter intimidade com
avaliações estatísticas, distribuições, correlações, dentre outros.
Se você está em uma grande empresa que tem enormes quantidades de dados, ou em uma empresa em que o produto em
si é especialmente orientado a dados, pode ser o caso de se familiarizar com métodos de machine learning, como
abordagens de aprendizagem profunda.
Compreender esses conceitos é mais importante em empresas em que o produto é definido por dados, e pequenas
melhorias em performance preditiva ou otimização de algoritmos podem significar enormes conquistas.
Prover visualizações e comunicar dados é algo superimportante, especialmente em empresas em que as decisões são
orientadas a dados ou em organizações em que os cientistas de dados são tidos como capazes de orientar os gestores a
tomar as decisões baseadas no conhecimento gerado.