Nouvelles données de mobilité

Modélisation et Représentation

Les nouvelles données sont celles issues de dispositifs dont, soit le développement, soit la diffusion au grand public, sont récents. Les nouvelles données sont intimement liées à l’image “innovante” renvoyée par leur dispositif de génération ou de collecte. 

 

Elles sont également définies par rapports aux “anciennes données”, ou “données historiques”, collectées par les systèmes antérieurs à leur apparition, et qui véhiculent alors une image de conservatisme technologique, voire d’insuffisance par rapport au “monde moderne”. 

 

Les nouvelles données semblent souvent être vues comme une fin en elles-mêmes : le développement de systèmes techniques visant à les traiter, les stocker prenant le pas sur les interprétations. L’usage découle naturellement d’une analyse statistique. Les données innovantes véhiculent l’idée de masse (Big Data, données massifiées). 

 

L’illustration, l’animation mettent en perspective les nouvelles données. Les nouvelles données sont vues comme autant de réponses insoupçonnées à des questions que l’on ne se posait pas forcément auparavant. 

 

La corrélation statistique, à travers le croisement de ces nouvelles données, devient une fin en soi. Souvent, l’adage corrélation ne vaut pas causalité est répété, pourtant c’est son contraire qui est mis en œuvre. 

 

Ce qu’on appelle une « nouvelle donnée » est une donnée qui n’existait pas avant les progrès technologiques liés au numérique. Ce qui est le plus frappant dans ces nouvelles données est leur masse bien sûr (les fameux « big data », de l’ordre de 1024 bits d’information générés par an en ce moment) et leur versatilité : une donnée est mesurée par quelqu’un (un individu, une entreprise, un Etat) pour quelque chose, puis peut être utilisé par n’importe qui pour n’importe quoi (sauf garde fous spécifiques ou problèmes – parfois très compliqués – de traitement). C’est à la fois la grande force de ces nouvelles données, et la raison pour laquelle elles sont aujourd’hui au confluent de nombreux enjeux de société. 

 

Dans le domaine des transports, de la mobilité et de l’aménagement, un vaste ensemble de technologies nouvelles a décuplé les possibilités d’observer ce qui se passe dans le système (les véhicules sur le réseau, via les systèmes d’aide à l’exploitation, les personnes dans les véhicules ou dans l’espace public, via des capteurs fixes ou mobile). A titre d’exemple, les traces GPS laissée par les utilisateurs de téléphone portable peuvent être utilisées par les municipalités pour mieux aménager leurs villes (via des outils de visualisation développés par les opérateurs téléphoniques), ou par des collectifs d’habitants ou d’associations pour tenir à jour des cartes collaboratives comme openstreetmap, notamment en situation de crise (Zook et al., 2010). 

 

Une partie des « nouvelles données » dans le champ de l’aménagement et des transports présente la particularité d’être des données individuelles, obtenues avec un degré de consentement très variable des personnes concernées. Outre les débats éthiques que cela implique (1 personne peut être identifiée presque certainement avec seulement 5 localisations récurrentes – de Montjoye et al., 2013), il s’agit d’un changement technique qui va de pair avec un changement de paradigme de la production urbaine, qui met de plus en plus les habitants, les usagers, au cœur des projets urbains. Goodchild (2007) parle de human as sensors ; c’est ce qu’on peut observer avec les données GPS de Waze, obtenues par crowdsourcing, permettant aux conducteurs de gagner du temps sur les trajets grâce aux infos renvoyées par les autres conducteurs sur l’état du trafic. 

 

Les données produites dans un système social émanent d’un point de vue et permettent d’objectiver des options envisagées, au sein d’un processus de décision, qui sont portées par un ou des acteurs particuliers. Il n’y a pas de donnée neutre (Desrosières, 2013). Dans le champ d’application des transports de l’aménagement et de la mobilité, la production et le traitement des données s’intègrent dans un processus de décision, allant d’un problème à résoudre (par exemple la congestion sur les routes à l’heure de pointe) à une solution (par exemple, des incitations à la densification autour des gares), en traversant plusieurs stades : formalisation (on exprime le besoin de connaître le nombre de véhicules passant sur les axes les plus problématiques), mesure (d’abord dans les années 1960 par boucles magnétiques, puis plus récemment par des données issues des GPS / FCD / FMD des véhicules), modèle permettant de compléter les inévitables « trous » dans les données (modèle à 4 étapes statique d’abord puis modèles « LUTI » intégrant les choix des ménages de s’installer de plus en plus loin du centre-ville) et exploitation des sorties du modèle (par le biais d’indicateurs). C’est ce qu’Hadrien Commenges (2013) appelle une « matrice technique ». Les données, qu’elles soient anciennes ou nouvelles, sont un maillon d’un chaîne qui ne peut être brisée sans perte de compréhension du processus dans lequel elles s’intègrent. 

 

C’est pourquoi la technologie ne peut pas d’un coup tout chambouler : tant que les problèmes d’aménagement, les compétences techniques des acteurs territoriaux et les capacités de modélisation des ingénieurs restent les mêmes, la capacité de produire des nouvelles données ne change pas grand-chose à la pertinence et même à la nature des décisions qui seront prises. Le foisonnement récent de discours autour du « big data » tient pour partie de réels changements sur les acteurs de l’aménagement (issus du mouvement de décentralisation dans un grand nombre de pays et de l’émergence de collectifs citoyens plus structurés), des problèmes que doivent traiter ces acteurs dans les pays occidentaux (enjeux de pollution en ville, de qualité de vie, d’hypermobilité, de préservation des ressources environnementales, à partir d’une démographie plus ou moins stagnante) et moins comme avant de course entre construction d’infrastructure et croissance démographique. La profusion de nouvelles données promet à ces multiples acteurs de pouvoir agir à leur échelle et dans leur domaine de compétence avec une temporalité plus courte. 

 

Au LVMT, les travaux mettant au cœur ces nouvelles données sont nombreux, et en sont au stade de la comparaison et du croisement avec les données classiques (Enqûetes Ménages Déplacement, Recensement de Population de l’INSEE). Les verrous scientifiques et techniques que ces nouvelles données promettent de lever concernent l’augmentation et l’harmonisation de la connaissance dans le temps et dans l’espace, notamment à l’échelle internationale, des pratiques de mobilité. La possibilité de disposer de davantage de données longitudinales (c’est-à-dire où on suit les décisions des mêmes personnes à plusieurs dates) doit permettre de mieux comprendre les processus de décisions opérés par les individus et les ménages dans leurs processus de choix résidentiels et d’organisation du temps (les programmes d’activités hebdomadaires). A titre d’exemple, dans le périurbain notamment, où la lutte contre l’autosolisme apparaît la plus complexe, il ressort que l’instrumentation de connaissance classique est largement insuffisante pour comprendre les contraintes et les flexibilités dont disposent les ménages dans l’établissement de leur programmes d’activités hebdomadaires (Nessi et al., 2016). 

 

Mais les nouvelles données en transport et en aménagement sont aussi un marché. Le rapport Jutand (2015) produit des réflexions très intéressantes sur ce qui, des données produites par les organismes publics, doit être librement disponible ou pas (démarche « Open Data »). La même question se pose bien sûr aussi pour ce qui concerne les acteurs privés, beaucoup issus des télécoms (opérateurs téléphoniques) et de l’internet (Google et consort). Les acteurs de ce marché sont nouveaux, et comprennent à quel point les urbanistes, aménageurs et acteurs classiques du transport ont besoin de leurs données ; dans le même temps les acteurs publics ont fait dans les dernières années des pas dans le sens d’une plus grande ouverture des données (par exemple l’INSEE donne annuellement au lieu de tous les dix ans les résultats du recensement de population, et divulgue certaines information à un niveau géographique extrêmement fin – données carroyées, Pivano, 2016). Se pose ainsi la question de la propriété des données, de l’interopérabilité, du traitement des données dans un cadre préservant l’individu, de la pérennité des données, du partage entre acteurs ans modèle de gouvernance qui soit clair. Tous les modèles sont faux, mais certains sont utiles » disait G. Box. Devant le vertige de l’hyperquantification il m’amuse d’ajouter « toutes les données sont vraies, mais certaines sont utiles » ; encore faut-il se demander à qui, et à quoi. 

 

Références:

– de Montjoye, Y.-A., Hidalgo C., Verleysen M., Blondel V. (2013), « Unique in the Crowd : The privacy bounds of human mobility », Nature Scientific Reports, 3 : 1376, DOI : 10.1038/srep01376 

– Goodchild, M. F. (2007), « Citizens as sensors : the world of volunteered geography », GeoJournal, 69(4), 211-221. 

– Desrosières, A. (2013). Pour une sociologie historique de la quantification: L’Argument statistique I. Presses des Mines via OpenEdition. 

– Commenges, H. (2013). Socio-économie des transports: une lecture conjointe des instruments et des concepts. Cybergeo: European Journal of Geography. 

– Nessi, H., Le Néchet, F., Terral, L. (2016), « Changement de regard sur le périurbain, quelles marges de manoeuvre en matière de durabilité ? », Géographie, Économie, Société, 18, 15-33 

– Pivano, C. (2016), « Désagrégation spatiale des données de mobilité du recensement de la population appliquée à l’Ile-de-France », Thèse de doctorat de l’Université Paris-Est. 

– Zook, M., Graham, M., Shelton, T., Gorman, S. (2010), « Volunteered geographic information and crowdsourcing disaster relief : a case study of the Haitian earthquake », World Medical & Health Policy, 2(2), 7-33