A l’heure du numérique, le nombre de données collectées augmente de manière exponentielle. Le réel trouve progressivement son empreinte numérique dans tous ces aspects. Cependant, dans l’état actuel des choses, les données sont gardées chacune de leur côté, ce qui ne permet pas de développer leur plein potentiel. La question de la gestion de ces données s’avère donc primordiale à travers notamment un aspect en particulier : l’open data.
L’open data (en français : les données ouvertes) est à la fois un mouvement, une philosophie, une politique et une pratique de partage libre et gratuit des données privées, publiques ou issues de la société civile dans des formats permettant leur réutilisation. Les objectifs recherchés sont ceux du libre accès à l’information et de la transformation de la donnée numérique en bien commun. Il s’agit de donner la possibilité au citoyen d’avoir accès aux données et, le cas échéant, de les retravailler .
Avant d’aller plus loin, il est opportun de définir ce qu’est une donnée. La donnée est une information élémentaire, brute, qui n’a pas encore été interprétée ou contextualisée. Une donnée n’est ouverte que s’il est possible de l’utiliser, de la réutiliser et de la redistribuer librement – avec, comme seules conditions admissibles, d’une part, l’obligation d’en mentionner la source et, d’autre part, la nécessité de permettre la réutilisation de toute base de données dérivées sous les mêmes conditions que la base de données originale. Une caractéristique centrale réunit donc le mouvement de l’open data : une donnée ouverte implique sa libre réutilisation. Dans le secteur public, l’open data pourrait être définie comme la mise à disposition libre et gratuite de données qui implique la possibilité de les réutiliser de la façon la moins contraignante possible. [1]
Potentiellement, toute donnée, tant qu’elle ne relève pas de la vie privée des individus, peut être partagée, tout dépend de l’Etat et du droit en place de ce dernier. Il y a cependant un intérêt certain pour les données de type géographique, cartographique, financier, économique, démographique, statistique, juridique, météorologique et concernant les transports, les musées et la culture.
La sunlight foundation [2] a identifié 10 critères caractérisant une donnée ouverte. Elle doit être :
Quels en sont les avantages ?Ceux-ci sont variés. L’open data permet une grande avancée en matière de participation citoyenne et de transparence, notamment concernant les relations entre administration publique et société civile. La transparence et le croisement des données ouvertes peuvent avoir des effets très positifs. Par exemple, la Grande-Bretagne a connu une diminution de 30% de la facture de consommation d’énergie dans les bâtiments publics en seulement 2 mois [3]. De plus, l’impact économique de l’open data a été évalué à 140 milliards d’euros par an pour l’Europe. Outre la réduction des coups, les bénéfices tirés de l’open data ne peuvent être déterminés puisqu’ils dépendent des usages innovants, des services que les citoyens en feront. Par exemple, il existe des cartes pour le déplacement des personnes handicapées parce que un citoyen en a eu l’idée et a décidé de la mettre en œuvre, mais ça aurait pu être autre chose. Chaque citoyen, en partageant des données, pose un acte qui bénéficie à la société. Enfin, l’open data peut aussi s’inscrire dans une logique environnementale, par le fait même du partage des connaissances sur les phénomènes naturels.
L’open data présente toutefois quelques inconvénients. [4]Certaines applications possibles grâce à l’open data dérangent. Les exemples de BeenVerified.com qui indique les adresses des délinquants sexuels répertoriés, ou de Whoslobbying qui croise les agendas des ministres aux rendez-vous qu’ils ont avec le milieu des affaires soulèvent des questions.. En ce qui concerne le coût, il reste faible, mais les moyens investis le sont encore plus, que ce soit aux USA, en France ou au UK, par conséquent, les projets d’open data ne sont pas aussi aboutis qu’ils pourraient l’être. Il y a également une inégalité dans les données libérées selon le domaine, certains domaines n’entrant pas du tout dans l’open data, ce qui découle du problème que certaines personnes politiques et entreprises freinent l’ouverture des données et la transparence.
Lorsqu’il s’agit du numérique, la question technique, bien que peu attractive, est d’une importance capitale. En 2010, Tim Berners-Lee a proposé une échelle de qualité des données ouvertes, des moins bonnes aux meilleures. [5]
1. Données non filtrées (éventuellement dégradées) par exemple mises en ligne avec n’importe quel format.
2. Données disponibles de manière structurée (ex : données tabulaires en CSV, XML, Excel, RDF).
3. Données librement exploitables juridiquement (cf. licences) et techniquement (dans des formats non-propriétaires, pas sous Excel notamment).
4. Données identifiées par des URL (avec date de mise à jour) afin que l’on puisse « pointer » un lien vers elles (et la retrouver éventuellement mise à jour).
5. Données liées à d’autres données, pour les contextualiser et les enrichir.
Les deux principaux critères pour une bonne donnée ouverte sont le format standard, qui permet un accès à partir de n’importe quelle machine, et l’interopérabilité, qui permet aux utilisateurs de croiser et remixer les données, ce qui n’est possible que si les données sont partagées dans des formats standards.
L’open data nécessite une licence fixant les conditions de copie, de diffusion, de réutilisation libre. Il existe plusieurs licences dont certaines sont reconnues internationalement, comme Open Database de l’open knowledge foundation ou les licences Creative Commons. Cependant, face aux différents droit nationaux, les licences internationales ne conviennent pas toujours. La France s’est ainsi dotée de sa propre licence nationale concernant les open data. La diversité des licences peut poser des problèmes pour la réutilisation des données ainsi qu’une complexité au niveau juridique. Pour l’instant, aucune licence open data ne comporte de clause demandant des données dans un format ouvert, interopérable, et si possible, structuré, ce qui pose des problèmes de qualité.
Au-delà de la technique, l’open data s’ancre et s’adapte à différents États, différentes régions et cultures, ce qui crée une grande diversité. Il est d’ailleurs tout à fait paradoxal que cette ouverture des données numériques reste finalement fort centrée sur un territoire, ou une ville. Ce phénomène est également universel, comprenant des centaines d’initiatives dans plus de 40 pays différents. Nous nous intéresserons ici à 4 États pionniers dans l’open data : la France, des États-Unis, le Royaume-Uni, et le Canada.
4.1.La France
La France est le premier État à avoir mis des données en ligne gratuitement en 2002, essentiellement autour des données juridiques disponibles. Une particularité française de l’open data est que le projet est porté par les collectivités locales et les mouvements civiques . Les collectivités les plus avancées se trouvent à Rennes, Brest, Paris, et en région d’Aquitaine. Ces villes ont joué un rôle stratégique primordial dans le mouvement de l’open data. En 2011 est créée la « mission étalab » qui est chargée de créer et d’alimenter le portail de données publiques ouvertes data.gouv.fr. Cette structure a aussi lancé récemment Dataconnexions, un réseau d’acteurs des données ouvertes afin de dynamiser ce secteur de l’économie numérique.L’association OpenDataFrance est aussi à mentionner, ayant réunit les collectivités engagées dans l’ouverture des données publiques.La France a, en outre, intégré l’Open Government Partnership (Partenariat pour un gouvernement ouvert), qu’elle va coprésider en 2016-2017. Il s’agit d’une enceinte où les États coopèrent sur ces questions, partagent leurs bonnes pratiques et peuvent éventuellement élaborer des standards. [6]
Concernant le type de données ouvertes, ces dernières sont surtout de données cartographiques, comme à Paris où existe, entre autres, une carte sur l’histoire du nom des rues, une carte électorale interactive, une carte des 70 espèces d’arbres à Paris (utile pour les allergies par exemple)… Cependant, une liste exhaustive des réalisations issues de l’open data est inutilel’imagination des créateurs étant sans limites.
Cet illustration du cas français permet de se rendre compte de la variété des acteurs et de la précocité de la prise en compte de l’intérêt de l’open data par les pouvoirs publics..
4.2.Les États-Unis
Il faut attendre l’élection de Barack Obama pour qu’en 2009, les États-Unis se lancent dans les projets publics liés à l’open data, via le projet data.gov. La libération des données a donné naissance à une économie des applications et au renforcement des communautés de développeurs.
4.3.Le Royaume-Uni
Au Royaume-Uni, c’est en 2010 que l’open data voit le jour avec le site « Acts and statutory » qui oblige le gouvernement à publier, entre autres, toute dépense supérieure à 25 000 livres sterling. Ce site utilise les technologies du web sémantique de Tim Berners-Lee. Data.gov.uk est venu renforcer, depuis, ces utilisations publiques.
4.4.Le Canada
Au Canada, le site data.gc.ca est lancé en 2011. Et c’est en 2012 que suit le plan d’action du Canada pour un gouvernement ouvert, reprenant 3 critères :
Ville de Rennes
La ville de Rennes est pionnière dans l’open data en France, ayant initié une telle démarche au printemps 2010 [7]. Avec deux sites internet, deux grands acteurs publics ouvrent leurs données à Rennes. Le premier acteur, Rennes Métropole, a fondé son entrepôt de données sur data.rennesmetropole.fr et regroupe plus de 200 jeux de données ouvertes. [8]Le second acteur, Kéolis Rennes a créé son entrepôt sur le site star.fr qui concerne uniquement les transports. [9] L’open data à Rennes, c’est aussi une communauté. Sur meetup.com se retrouve le Rennes Data Club, de 168 membres, qui se réunit autour d’événements concernant l’open data [10]. Un Collectif Open Data Rennes s’est également créé, disposant notamment de son blog sur cod-rennes.fr [11], ainsi que le forum sur le site data.rennesmetropole.fr .
Les types de données partagées sont multiples, allant de la géolocalisation des équipements publics, aux budgets, en passant par les transports, la culture, l’état civil, les marchés publics, les statistiques de collecte des déchets et ou de fréquentation des équipements publics, les événements sportifs et culturels, etc. Ces données sont interopérables et certaines sont disponibles en temps réel.
Concernant les interfaces de programmations, comme les API (Applications Programming Interface) qui permettent d’accéder à une application et d’échanger des données, la ville de Rennes dispose d’outils disponibles sur le site data.rennesmetropole.fr, à savoir :
Comment les données ont elles été réutilisées ?
Elles peuvent être réutilisées par n’importe qui, et de diverses manières :
Il existe également d’autres applications, telles que Ren’circul, qui propose des informations sur les travaux et leur impact sur la circulation ; JooSport, qui permet de trouver un lieu ou des coéquipiers pour le sport, ou encore d’organiser un événement sportif ; Et geoVelo pour trouver des bons itinéraires à vélo. [17]
Les différents sites cités sont extrêmement modernes, clairs et simples, agréables à parcourir, ce qui ne peut qu’encourager les gens à les utiliser. Ce bref aperçu de l’open data à Rennes donne une idée du développement et des applications possibles dans une ville où le pouvoir local a décidé de s’y mettre.
5.2. Ville de Chicago
Chicago est, tout comme Rennes, une des premières villes à créer un portail d’open data en 2010. Durant cette même année, la ville a vu naître une communauté de hackers civiques, c’est-à-dire des individus utilisant leurs compétences informatiques pour améliorer la ville. [18]Cette communauté est maintenant la plus grande au monde. Le portail « City of Chicago » héberge aujourd’hui plus de 1000 jeux de données. [19] La ville de Chicago est également dotée d’un portail, MetroChicagoData [20], regroupant les données des portails des différents niveaux de pouvoir concernant les Habitants de Chicago. C’est-à-dire :
Pour stimuler l’intérêt autour de l’open data, la ville a concentré son attention sur les développeurs, les hackers civiques, les analystes et les hommes d’affaires étant ceux qui vont décortiquer l’information ouverte par la ville pour répondre à des problèmes et offrir de nouveaux services. Comment ? En hébergeant des concours, hack night, ou encore des hackathons, qui sont des événements autour des open data. Plus précisément, ce sont des rassemblements de programmers qui codent, sur le projet de leur choix, le plus possible sur une courte période, une semaine maximum. [23]
De nombreuses applications ont été créées grâce à ces différents outils et incitants dont voici deux exemples :
6.1. Etat des lieux
En Belgique, 43% des données sont déjà partagées, classant le pays au 35ème sur 122 au Global Open Data Index, sachant que le premier, Taïwan, partage 78% de ses données et le dernier, Myanmar, partage 3%. [26] La Belgique se situe donc un peu au-dessus de la moyenne et se retrouve, comme la France avant elle, dans une logique de bottom up, les initiatives provenant d’abord de collectivités locales. Il a fallu attendre 2015 et Alexander De Croo avant de voir le pays réellement s’engager dans cette voie. L’avancement dans l’ouverture des données est très inégal d’une région à l’autre, les Flamands ayant débuté plus tôt que les Wallons, et les Bruxellois. Cette différence est visible notamment sur le site data.gov.be, où la majorité des publications concerne la Flandre.
Les Belges utilisent plusieurs licences et plusieurs types de fichier dont certains impossibles à ouvrir sur certains ordinateurs, ce qui rend l’interopérabilité moins importante. En outre, les données sont éparpillées dans beaucoup de bases de données différentes, dont 1 pour chaque région et 1 pour le fédéral, cette diversité apportant une certaine complexité. [27]…
6.2. Pour plus d’open data en Belgique
Voici 3 trajectoires que la Belgique devrait suivre pour plus et de meilleures données ouvertes :
Si ces deux conditions sont réunies, il est intéressant de se lancer dans le projet, mais comment faire ? Plusieurs étapes peuvent être proposées :
L’open data possède un potentiel incroyable, tant au niveau de transparence que du dynamisme citoyen et de l’innovation. Elle est déjà implantée dans beaucoup de pays et tous peuvent encore aller plus loin et s’améliorer, la Belgique ne faisant pas exception à la règle. Certes, il s’agit d’un sujet technique, qui peut représenter une barrière pour certains. Cependant, cet aspect doit être transcendé pour prendre conscience des possibilités. Cette conclusion optimiste nécessite de prendre en considération un bémol. En effet, il semble pertinent de s’interroger sur l’impact du numérique en matière de consommation d’énergie des serveurs avant de ce lancer dans un tel projet. Le numérique semble immatériel, pourtant il s’agit d’une illusion. L’impact environnemental de l’open data doit donc faire l’objet d’une réflexion plus poussée, afin de lever toute ambiguïté quant à son utilisation par rapport aux enjeux écologiques.
[1] Danièle Bourcier, Primavera De Filippi, « L’Open Data : universalité du principe et diversité des expériences ? », La semaine juridique - ́edition générale, LexisNexis, 2013, pp.1-9.
[2] Sunlight foundation, 2010, https://sunlightfoundation.com/policy/documents/ten-open-data-principles/
[3] Citation de Charles-Henri Schulz lors de l’atelier Open data, open standards lors de l’Open World Forum du 24 septembre 2011
[4] Ibid.
[5] Linked Data, https://www.w3.org/DesignIssues/LinkedData.html
[6] Bruno Texier, « Open data : capitale mondiale d’un gouvernement ouvert », archimag.com, 2017
[7] “L’open data”, Economie & recherche, Le site de Rennes, Ville et Métropole, 28 septembre 2016
[8] Rennes métropole en accès libre, data.rennesmetropole.fr
[9] Star, star.fr
[10] Meetup, meetup.com
[11] Collectif Open Data Rennes, cod-rennes.fr
[12] “L’open data”, Economie & recherche, Le site de Rennes, Ville et Métropole, 28 septembre 2016
[13] Plateforme de datavisualisation des données budgétaires de la ville de Rennes et de Rennes métropole, http://dataviz.rennesmetropole.fr/budget/
[14] Qui sommes nous ?, http://dataviz.rennesmetropole.fr/quisommesnous/index-fr.php
[15] Data BZH, data-bzh.fr
[17] “L’open data”, Economie & recherche, Le site de Rennes, Ville et Métropole, 2016
[18] Sean Thornton, “Open Data in Chicago, A Comprehensive History”, Data-Smart City Solutions, 2016
[19] City of Chicago, Data Portal, data.cityofchicago.org
[20] MetroChicagoData, metrochicagodata.org
[21] Open Data Executive Order (No. 2012-2), City of Chicago, https://www.cityofchicago.org/city/en/narr/foia/open_data_executiveorder.html
[23] Techopedia, techopedia.com
[24] Crime in Chicago, crimeinchicago.org
[25] Chicago Councilmatic, chicagocouncilmatic.org
[26] Global Open Data Index, http://index.okfn.org/place/
[27] “The state of Open Data in Belgium”, Open Knowledge Belgium, https://www.openknowledge.be/open-data-in-belgium/
[28] Brett Goldstein, “Beyond Transparency, Chapter 2. Open Data in Chicago : Game On”, 2013