Science des données

Mis à jour le 8 avril 2024 à 18:41

La science des données, ou data science, est un domaine interdisciplinaire qui utilise des méthodes scientifiques, des algorithmes et des processus pour étudier les données afin d'en extraire des connaissances et des informations à partir de données structurées et non structurées. Son objectif principal est de découvrir des modèles, des tendances, des relations ou des informations cachées dans les données afin de prendre des décisions ou de résoudre des problèmes complexes. La science des données passe par la collecte, le nettoyage, l'exploration et la modélisation des données, pour terminer sur l'interprétation et la communication des résultats. Aujourd'hui, la science des données est très utilisées par les entreprises.

En apprendre plus sur la science des données sur le site d'Azure Microsoft.

Projets

Projets employant le langage R :

  • The "Virtual Poeymaü" application

    L'application web "Virtual Poeymaü" est une application hébergée sur la plateforme Huma-Num et créée en 2021. Elle emploie le langage R et permet de spatialiser les données de la grotte de Poeymaü (Arudy, Pyrénnées, France). Le site est visualisable en 3D et propose une spatialisation des données de fouilles, tels que les plans ou les artefacts (15 500). Via des filtres, les différents types de données peuvent être activés ou désactivés. Il est également possible de "remonter le temps" afin d'explorer la chronologie des fouilles, et donc des données, de 1951 à 1985. Accéder à la page Hypothèses du projet. Accéder au code source de l'application disponible sur GitHub.