Au début des années 2000, les scientifiques de la donnée étaient principalement des mathématiciens, des physiciens et des statisticiens qui travaillaient dans des services isolés. Ils codait et extrayaient manuellement des données pour produire des informations commerciales. La science de la donnée est encore une discipline assez récente et il faut du temps, des ressources et des formateurs pour mettre en place un programme d’enseignement partant de zéro.
Le fossé entre le paysage technologique actuel et les compétences enseignées est une problématique persistante. De nos jours, nous sommes en train de générer une quantité considérable de données et les entreprises cherchent de plus en plus à les utiliser pour prendre des décisions éclairées rapidement. Toutefois, le nombre de professionnels qualifiés qui arrivent sur le marché du travail, ou le réintègrent, ne parvient pas à satisfaire la demande d’intelligence décisionnelle et d’informations pertinentes.
Puisque les entreprises ont besoin de prendre des décisions éclairées, elles doivent pouvoir s’appuyer sur des données précises. L’humain reste le moyen le plus efficient de construire des bases. Il s’agit de mettre les bons outils entre les mains des employés qui possèdent les connaissances métier et qui comprennent également le contexte de la problématique à résoudre.
C’est probablement à cause de leur visibilité précoce dans un nouveau domaine que les scientifiques de la donnée sont devenus synonymes d' »analytique des données », conséquence d’un manque de compréhension tant dans le monde de l’entreprise que chez les professionnels de l’enseignement. Il en résulte un malentendu général, qui laisse penser que la solution à ces défis de l’analytique des données passe par le recrutement de scientifiques de la donnée hautement qualifiés, capables de coder manuellement des solutions pour générer de la valeur métier. Cependant, l’apprentissage du codage ne comblera pas à lui seul le déficit de compétences en analytique des données. La solution à ce déficit de compétences en sciences, technologie, ingénierie et mathématiques (STEM) ne dépend pas des codeurs, mais plutôt des experts d’autres domaines qui ont à la fois la curiosité et la maîtrise des données.
Comme le dit justement la citation « Si vous étiez perdu, vous ne demanderiez pas votre chemin à une équipe de science des données, mais à un taxi ». Cette compétence d’expert est irremplaçable. De même, tous les apprenants n’ont pas nécessairement besoin de savoir coder. Python ne transforme pas une personne ordinaire en un analyste de données de haut niveau, car ce langage informatique ne devrait pas être une compétence obligatoire pour l’analyse de données. En revanche, former des collaborateurs experts dans un domaine à des outils d’analyse de données accessibles signifie qu’ils peuvent travailler plus étroitement avec l’équipe de scientifiques de données et, bien souvent, ils peuvent résoudre leurs propres problèmes à leur rythme.
En fin de compte, il est nécessaire de comprendre que la science de la donnée ne se compose pas uniquement de codage et d’algorithmes complexes. C’est une discipline qui exige des compétences de résolution de problèmes, de compréhension métier et de curiosité. Pour combler le déficit de compétences en analytique des données, nous devons nous concentrer sur la formation des experts de domaines divers et variés et leur fournir les outils d’analytique de données nécessaires. De cette manière, nous pouvons créer une culture de l’analyse de données qui englobe toutes les compétences et les perspectives, et qui permettra aux entreprises de prendre des décisions éclairées basées sur des données pertinentes.