Espace de Réflexion Ethique des Pays de la Loire (EREPL)

Accueil

Juillet 2018 - Agenda éthique de la région




Juillet 2018


philo science

4 au 6 juillet 2018


"Théorie et données à l'heure des données massives"

VIIème Congrès de la Société de Philosophie des Sciences 
"


L’utilisation croissante des « données massives » dans de nombreux domaines scientifiques et techniques, depuis les sciences du climat jusqu’aux sciences de la santé en passant par l’exploitation des réseaux sociaux à des fins diverses d’explication, de prédiction ou de décision, soulève des questions nouvelles pour la philosophie des sciences. Qu’a-t-elle à dire de l’irruption des données massives dans tous ces champs ? En particulier, comment modifie-t-elle la pratique scientifique ?

Données massives et données. Qu’est-ce qui distingue les données « massives » des données en général ? La première question est peut-être de savoir s’il existe une masse critique de données à partir desquelles elles peuvent être dites « massives » et comment définir ce seuil, ou bien si c’est à cause d’une certaine manière de traiter un même corps de données qu’elles peuvent (ou non) être dites « massives ». On peut aussi se demander si la disponibilité d’une grande quantité de données a déclenché un changement dans la pensée scientifique, ou bien si la recherche d’une grande quantité de données a suivi un tel changement.

Données massives et algorithmes. Les données massives se caractérisent par une automatisation du traitement et par la constitution d’un ou plusieurs algorithme(s), notamment des algorithmes d’apprentissage. Qu’est-ce qu’un algorithme ? Quelles sont les potentialités et les limites de ces algorithmes ?

Intelligibilité et données massives. Quoique l’algorithme ne soit pas une nouveauté, sa généralisation, sa complexification et sa performance conduisent à s’interroger sur une mutation du rapport de la pensée scientifique à ses objets : moins direct, de supervision davantage que de vérification intégrale, ce rapport doit désormais compter avec la « boîte noire » d’un algorithme. Quel impact sur la nature de la pensée scientifique ? La science fait-elle désormais l’économie de théories ? Que signifie l’expression data-driven science ?

Qualité des données massives. La massification des données limite la possibilité de contre-vérification ou de croisement. Est-ce que leur grande quantité compense l’inévitable problème de la qualité des données massives, ou bien n’obtient-on en sortie du traitement que la qualité même des données entrées, selon le principe : garbage in – garbage out ? Qu’est-ce que le passage aux données massives change au régime de la preuve dans les différentes sciences ?

Structure et conservation des bases de données. Au-delà de la question de l’information retenue dans une base de données, se pose aussi la question de la structuration de cette information : quelle ontologie pour les données massives ? Comment se font et comment devraient se faire les choix de standards ? Comment exploiter des données structurées de manières différentes ? Se posent aussi des question de conservation, notamment, comment se conservent les données face à la menace d’obsolescence du format dans lequel elles sont conservées (changement de logiciels ou de version de logiciels) ?

Nantes

Inscription : karine.lejeune@univ-nantes.fr
Plus d'information ICI