Dans un numéro de cette revue consacré à l’enjeu archivistique, il importe de présenter et d’analyser les débats en cours concernant les droits émergents liés à la généralisation de l’usage d’Internet dans tous les domaines de la vie contemporaine. Sans entrer dans les détails juridiques, cette contribution se veut une ébauche de réflexion sur le bouleversement actuellement en cours dans le partage d’information dans nos sociétés devenues numériques.

Le réseau mondial est souvent présenté comme la plus grande bibliothèque virtuelle jamais constituée. Il est vrai que pour la première fois dans l’histoire de l’Humanité, une quantité de sources, semblant a priori infinie, des documents de tous types sont rendus accessibles, consultables et téléchargeables par tout qui possède des outils informatiques et un accès au réseau. Ces vingt dernières années, l’évolution d’Internet a montré la puissance, la rapidité, les opportunités politiques de cette technologie notamment en matière d’accès à l’information et de production scientifique et culturelle. Aujourd’hui, la diffusion de cette technologie est croissante. Les possibilités de développement économique ont laissé croire à un nouvel Eldorado, faisant dire à certains économistes que depuis le début des années nonante, nous étions entrés dans l’ère de l’économie de la connaissance[[Artus P., La Nouvelle Économie, Collections Repères la Découverte, Paris, 2001.

]].

Si la fracture numérique est bien une réalité qui reflète les inégalités sociales et intellectuelles[[Valendus G., La Fracture numérique en Belgique, une analyse des données statistiques existantes, Fondation Travail-Université, octobre 2010 [En ligne]. www.ftu.be/documents/ep/2010_Etude_Fracture_numerique_en_Belgique.pdf (consulté le 23 juillet 2013).

]] et produit une forme de ségrégation dans l’accès aux outils informatique et au réseau internet, force est de constater que cette évolution technologique a concerné tous les aspects de notre société et a amené en deux décennies un plus grand nombre de citoyens à obtenir un meilleur accès à l’information, quelle qu’en soit son type.

La nature même d’Internet a transformé le rapport que nos sociétés entretiennent avec les biens dématérialisés : ces créations dont l’échange ou la représentation ne dépendent désormais plus du support matériel sur lequel elles étaient jusque là stockées (papier, disque) ou distribuées (télévision, cinéma, espaces de formation, etc.). Le fait qu’un bien culturel, une étude scientifique ou un rapport administratif soient aussi devenus des fichiers informatiques les rendent facilement réplicables et donc rapidement échangeables sur internet. A ce jour, toutes les tentatives industrielles de placer sur ces fichiers des modules techniques ou les initiatives politiques empêchant la copie ou le transfert généralisé se sont avérées extrêmement coûteuses et très inefficaces, comme l’a montré le débat récent sur le téléchargement dit illégal. Dans la société numérique, une fois le bien devenu un assemblage d’octets, il donne l’impression d’une totale accessibilité, toutefois entravée par la sphère marchande, nous le verrons.

Volatilité

La nature particulièrement volatile des biens numérisés pose ainsi la question des méthodes à mettre en place pour garantir la confidentialité des données à caractère personnel conservées par les entreprises et les services publics. En effet, dans l’économie de services d’aujourd’hui, quantités de données doivent être collectées pour en faciliter le fonctionnement. Celles-ci sont généralement présentes sur des serveurs physiques, mais avec des systèmes d’accès aux données de plus en plus organisés sous forme de clouds (« nuages »). Ces données sont alors stockées sur des serveurs extérieurs à l’entreprise avec le risque de ne plus avoir le contrôle sur leurs gestions. De simples erreurs de manipulation ou des tentatives de piratages peuvent alors donner lieu à une véritable violation du droit à la vie privée d’usagers ou de clients n’ayant rien demandé, comme ce fut le cas pour ce qui a été appelé le SNCB Gate en Belgique en 2013, lorsque les listes de clients des trains à grande vitesse (et surtout leurs données personnelles) ont été rendues involontairement accessibles à tous sur Internet.

Ceci n’a pas que des impacts négatifs. Internet a ainsi ouvert le champ à la diffusion culturelle et scientifique qui parfois n’avait pas la possibilité d’utiliser le canal d’édition traditionnel. A ce titre, l’émergence de la licence « creative commons »[[Le « Creative Commons » (ou CC) est une organisation mondiale sans but lucratif dont le but est de proposer une solution alternative au « copyright » et légale aux auteurs souhaitant partager des œuvres exemptes de droits de propriété intellectuelle restrictifs. Plusieurs types de licences sont proposés, selon le niveau de protection des droits souhaité. Etopia fonctionne d’ailleurs sous ce genre de licence.

]] apparaît comme un excellent compromis entre la diffusion maximale et gratuite des œuvres et le droit pour l’auteur de faire valoir ses droits de diffusions, exempts ici de dimension proprement financière. L’extraordinaire capacité des données numérisées à se reproduire partout sur la toile a un autre corollaire pratique intéressant : plus il en existe des copies de ces données, plus leur probabilité d’un jour être accessibles par les chercheurs du futur est grande.

Sédimentation dans un contexte

de monopole des outils de recherches

En effet, Internet et ses outils de classement (dits moteurs de recherche) ou de mise en lien (dits réseaux sociaux) agissent comme de véritables outils de sédimentation. A la façon des matières en suspension dans les cours d’eau ou océans, les informations sur un thème, un individu, une association ou n’importe quel autre aspect matériel ou immatériel de notre société se déposent dans le fond (ici, sur la toile) et restent donc à la disposition du quidam à la recherche d’une information liée à l’un ou l’autre aspect. Serait-ce là la concrétisation du rêve de tout chercheur et des historiens en particulier ? Sur le papier, la toile n’est donc pas seulement une interconnexion de fils ou câbles reliant les internautes, mais aussi une sorte de filet de pêche où viennent s’accumuler les données, de façon aléatoire et libre. Quoique.

En géologie, la sédimentation peut s’observer par le carottage ou l’extraction d’une zone à étudier : les couches sédimentées sont alors appréhendées par le chercheur dans l’ordre chronologique d’apparition. Dans l’univers numérique, le réseau peut correspondre à un dépôt d’archives mal rangé dont les différents moteurs de recherches correspondent aux instruments de recherches plus ou moins sommaires, précis et puissants.

La mise à disposition des données sédimentées sur la toile s’est donc accompagnée d’une marchandisation concomitante de la recherche sur le réseau. Dans ce contexte, le quasi-monopole actuel de Google[[Parts de marché des moteurs de recherche dans le monde, Journal du Net, 4 juin 2013 [En ligne]. www.journaldunet.com/ebusiness/le-net/parts-de-marche-des-moteurs-recherche-dans-le-monde.shtml (consulté le 28 juillet 2013)

]] pose légitimement des questions sur le caractère libre et non conditionné de la recherche sur Internet. Ce monopole commercial est d’autant plus inquiétant qu’il s’est accompagné dans le cas de Google d’un développement pléthorique d’outils économico-scientifico-culturels annexes, tous interconnectés avec son produit initial. Google Books est certainement le développement le plus caractéristique de cette volonté d’hégémonie commerciale inédite, qui a par ailleurs provoqué de vives réactions dans le monde de l’édition. Avec Google Actualités (ou Google News), la démarche est similaire mais concerne la presse. Elle a d’ailleurs été accueillie avec une très forte inquiétude des journalistes, qui en Belgique a même débouché sur un procès[[Parisi S. La mutation de la presse belge : Google VS la presse belge : qui a gagné au final, 15 décembre 2012 [En ligne]. http://intelligence-economique-belgique.blogspot.be/2012/12/la-mutation-de-la-presse-belge.html (consulté le 16 août 2013)

]]. En numérisant ou en reprenant sur ses plateformes commerciales quantité de textes de tout horizon, la firme américaine se veut le promoteur d’une véritable bibliothèque universelle, imposant ses conditions commerciales et en faisant plier auteurs et éditeurs face à ses intérêts mais aussi face à la prodigieuse force technique de son outil. Ce sont autant de textes, et donc autant de mots qui viennent grossir l’immense réservoir de données sédimentées sur lesquels les moteurs de recherches perfectionnés peuvent alors être lancés.

Les données sédimentées sur le réseau ne sont donc pas « toujours » accessibles librement. Dans certains cas, la recherche par les algorithmes secrets de Google est orientée par des intérêts le plus souvent commerciaux et plus rarement publics et démocratiques. Les moyens financiers importants développés tant par les entreprises que par les individus (fortunés) pour contrôler leur cyber-réputation tout comme les budgets développés par tant de structures pour augmenter le « ranking » de leurs pages web sur Google en sont la preuve. C’est d’ailleurs devenu une activité économique florissante, mais dépendante de la prédominance quasi-totale de ce seul acteur aux allures de Léviathan numérique. Avec ceci, s’ajoutent les récentes révélations du rôle joué par Google dans la transmission systématique de données et métadonnées, récoltées par son outil appelé PRISM[[PRISM est un programme secret de l’Agence de sécurité américaine (NSA) qui vise la surveillance électronique globale en collectant massivement et dans le monde entier des renseignements de toutes natures à partir d’Internet et de fournisseurs de services de communication par voie électronique. Son existence a été révélée durant l’Affaire Snowden en juin 2013 par le quotidien britannique The Guardian qui affirme que ce programme aurait directement accès aux données personnelles hébergées par les entreprises américaines actives dans les nouvelles technologies, parmi lesquels Google, Facebook, YouTube, Microsoft, Yahoo!, Skype, AOL et Apple.

]], vers les services de renseignements américains. Mais ce n’est pas le sujet de cet article. Il faut donc reconnaître que dans ce contexte, s’il est techniquement capable de sédimenter toutes les données une fois apparues sur la toile, le réseau n’est pas, dans les faits, une toile totalement hermétique à l’action commerciale et/ou étatique désirant supprimer une donnée dont l’accès public contreviendrait à des intérêts particuliers.

Question du droit à l’oubli

Mais de façon générale, la sédimentation potentiellement illimitée des données pose aussi la question du droit à l’image des individus et de son corollaire : l’éventuelle édification d’un droit à l’oubli, opposable aux sociétés commerciales de l’Internet et aux Etats.

La collecte tous azimuts de données à caractère personnel par les grands groupes privés amène les institutions européennes à plancher sur des projets législatifs[[Albrecht J. P., Proposition de règlement du Parlement européen et du Conseil relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données, décembre 2012 [En ligne]. www.europarl.europa.eu/meetdocs/2009_2014/documents/libe/pr/922/922387/922387fr.pdf (consulté le 17 septembre 2013).

]] visant à créer un droit aux implications radicales : celui-ci obligerait tous les organismes publics et privés à détruire ou à anonymiser les données une fois que le traitement pour lequel celles-ci ont été collectées sera dépassé, ou après un court délai. Ceci permettrait de garantir le droit fondamental de respect de la vie privée, bien compréhensible au regard de ce qui a été développé plus haut.

Des voix s’élèvent toutefois dans le monde sensible à l’enjeu archivistique[[Sourdès L., Droit à l’oubli sur Internet : la fin de la généalogie et des archives ?, avril 2013 [En ligne]. www.rue89.com/rue89-culture/2013/04/11/droit-a-loubli-internet-peur-archivistes-genealogistes-241208 (consulté le 17 septembre 2013).

]] sur les dangers de la mise en œuvre d’un tel projet. Dans sa mouture actuelle, le projet européen demande la destruction totale en faisant fi du besoin que pourraient avoir les futurs chercheurs en matière de données. Cela pose donc concrètement la question de la sauvegarde d’informations à caractère confidentiel dans l’ère numérique. Mais en prônant la destruction ou l’anonymisation de ces mêmes données, il apparaît que cette manière radicale d’envisager le respect de la vie privée se met en porte-à-faux avec le droit de la société du futur à pouvoir réfléchir à son passé, grâce à des documents de première main, comme le veut la méthodologie en critique historique. Les tenants d’un adoucissement des critères de destruction proposent ainsi de réfléchir plutôt au renforcement de la conservation sécurisée de notre patrimoine numérique et d’organiser l’accès à celui-ci dans des conditions respectueuses des libertés individuelles.

Absence de contextualisation

L’effet combiné de l’usage des réseaux sociaux et de la nature sédimentaire des données présentes sur Internet confronte l’usager à un autre enjeu de la recherche et de la présentation d’informations : l’absence de contextualisation d’une donnée recherchée sur la toile et sa validation scientifique.

Quand une page, un texte, une image, un son ou une vidéo sont en ligne, ils sont réappropriables par n’importe quel membre d’un réseau social, qui le « monte en épingle » par la simple mention sur celui-ci de son adresse sur Internet (URL). Mais parfois, cette mise en exergue se fait dans un contexte tout à fait différent de celui qui a vu naître le matériel représenté. Quantité d’articles de presse, de cartes blanches ou de photos jusque là enfuies dans les tréfonds de la « boîte à archives mondiale » sont de temps en temps, et à la faveur d’une requête ciblée, remis au devant de la scène numérique avec l’effet exponentiel du partage (et donc de la visibilité) que les réseaux sociaux permettent. Ainsi, cela donne une seconde, voire une troisième vie à quantité d’émissions de radio mais surtout de télévision parfois disparues depuis des décennies ;

Ceci a des aspects positifs, comme celui d’avoir une trace de toutes les œuvres, déclarations, attitudes et prises de position passées. Mais il est parfois dommageable pour un individu, une collectivité ou une entreprise de devoir porter des années durant les stigmates d’une expérience datée … et donc contextualisée. Le partage de l’information extrêmement rapide par les réseaux sociaux ne passant bien souvent que par une lecture sommaire du titre et des quelques mots repris en amorce du matériel présenté, la contextualisation de l’opinion ou du propos rapporté est souvent quasi-nulle. C’est une lecture approfondie, mais trop souvent rare, du document présenté qui permet alors de comprendre le contexte qui l’a vu naître. La généralisation des nouveaux moyens de communication rend d’autant plus crucial la formation à l’esprit et la recherche critiques en particulier chez les plus jeunes, nés avec ces nouvelles technologies.

Sites collaboratifs et Open Data

Notons aussi que des initiatives citoyennes et participatives ont également vu le jour grâce à la généralisation de l’usage du réseau. L’encyclopédie collaborative, participative et libre Wikipedia est le meilleur exemple de l’émergence d’un outil non commercial où les internautes de bonne volonté contribuent au savoir commun et universel, ce qui était l’objectif fondateur des premiers encyclopédistes du XVIIIème siècle. Les scientifiques et spécialistes, en participant au processus d’élaboration, ont donné le crédit nécessaire à cette initiative. Si le site est anonyme, une certaine publicité numérique peut aussi être donnée à leurs travaux, via les références bibliographiques mentionnées au bas des articles thématiques. Ce phénomène inédit est d’autant plus marquant qu’en une dizaine d’année à peine, Wikipedia est devenu la référence mondiale incontestée pour ce type de recherche, alors que les autres initiatives commerciales de ce type ont échoué[[Wiels J., Le succès de Wikipedia expliqué en cinq leçons, Regards sur le Numérique, octobre 2011 [En ligne]. www.rslnmag.fr/post/2011/10/14/Le-succes-de-Wikipedia-explique-en-cinq-lecons.aspx (consulté le 29 juillet 2013).

]].

Parallèlement, une proposition de directive européenne sur l’Open Data a vu le jour et sera prochainement transposée dans les diverses législations nationales. Cette nouvelle législation continentale visera à rendre publiques et accessibles toutes les données collectées ou consignées par les services publics[[Fauvel V., Open data : la révision de la directive de 2003 approuvée par le Conseil de l’UE, La Gazette des Communes, avril 2013 [En ligne]. www.lagazettedescommunes.com/163047/open-data-la-revision-de-la-directive-de-2003-approuvee-par-le-conseil-de-lue/ (consulté le 19 juillet 2013).

]]. Elles seront donc réutilisables par quiconque, moyennant des exceptions, dont bien sûr les données à caractère personnel. Le projet de texte prévoit la mise à disposition, le plus souvent gratuitement, d’un nombre très important de données. Pour les matières culturelles, des exceptions à la gratuité ou au paiement modeste pourraient être prévues, mais le texte prévoira une transparence quant à l’établissement des tarifs d’accès. Cette nouvelle mine d’or d’informations viendra grandir encore la manne des informations disponibles sur le réseau. En devenant la règle, la publicité des documents publics va incontestablement modifier le rapport des citoyens avec leurs diverses administrations, dans le sens où ces administrations seront contraintes par la publicité donnée à leurs actes de s’appliquer une meilleure gouvernance et une plus grande transparence.

Conclusion

L’émergence d’une société où le partage de données de toute nature se fait désormais via le canal d’Internet a incontestablement amplifié l’accès à l’information. Cette technologie pose toutefois une série de questions liées principalement au respect des droits fondamentaux (au premier rang desquels se trouve le droit à la vie privée) et à la question du monopole de grands conglomérats industriels numériques. L’équilibre à réaliser entre les deux pôles que sont la liberté d’accès et le respect des droits fondamentaux ne peut se forger que grâce au débat démocratique, garant de l’intérêt général. De ce débat démocratique dépend la régulation d’acteurs aussi puissants que Google et Facebook.

Sans naïveté technophile ou peur technophobe primaire, les futures décisions politiques en la matière devront garantir un accès historiquement inédit à l’information tout en balisant l’usage qu’Etats et entreprises actives dans ces secteurs des données numérisées pour qu’une trace historique des générations numériques puisse parvenir aux chercheurs et historiens du futur.

Internet n’a pas en soi altéré nos libertés fondamentales, il n’en a modifié que la manière dont nous pouvons les faire respecter.

Share This