Depuis quelques mois, l’open data a clairement fait son entrée dans les pages des médias français qui pour certains anticipent déjà sa fin. Mais que signifie réellement ce mouvement importé de la culture anglo-saxonne présenté comme un enjeu démocratique de transparence ? Simon Chignard, auteur du livre Open data, comprendre l’ouverture des données publiques, (paru chez Fyp éditions en avril 2012), conférencier, vice-président de la Cantine numérique rennaise et partisan actif de l’ouverture des données publiques de Rennes Métropole en 2010, territoire pionnier en France, nous explique les origines de l’open data, ses intérêts, ses utilisations pratiques et s’oppose à l’idée que cet outil serait un moyen de servir la transparence si chère à nos démocratie.
L’importation du terme anglais open data dans la culture française ne pose-t-elle pas un soucis de compréhension ?
En effet, le terme « open data » signifie trois choses en anglais :
- une caractéristique : open data = données ouvertes (pour qu’une donnée soit qualifiée d’ouverte elle doit répondre à des critères techniques, juridiques et économiques qui visent à en faciliter la réutilisation) ;
- un mouvement : open data = l’ouverture des données ;
- une injonction : open data = « mais ouvrez-les vos données, b … ! » (un cri de guerre envers les détenteurs des données, un cri de ralliement pour les partisans de l’ouverture, à l’instar du célèbre « Raw Data now ! » de Tim Berners-Lee).
L’open data est avant tout le fruit d’une culture politique anglo-saxonne (transparency, accountability, public scrutiny) très différente de la nôtre. On hésite encore sur le terme à employer en français : parle-t-on d’ouverture des données (comme je le fais) ou de « libération des données » ? Les deux termes ne disent pas exactement la même chose, je pense que le premier est plus neutre et le second plus moral, c’est le même débat opposant les partisans du free software, le logiciel libre dont fait partie Richard Stallman, et les partisans de l’open source, le logiciel à code ouvert, rassemblés derrière Eric S. Raymond.
Depuis quand l’open data a-t-il fait son apparition dans les politiques gouvernementales ?
En décembre 2007 à Sébastopol en Californie, au nord de San Francisco, dans la Napa Valley, a lieu un rassemblement de 30 personnes qui ont pour mission de définir ce qu’est une donnée ouverte. Cela se passe dans les bureaux de Tim O’Reilly, l’éditeur et auteur américain qui a notamment défini le concept de web 2.0. Ils vont élaborer une liste de 8 critères pour les données publiques ouvertes (Open Government Data). Leur objectif était de définir le principe et peut-être même de le faire adopter aux candidats aux prochaines élections américaines. Il n’y a pas qu’un enjeu marketing, mais aussi celui de savoir ce qu’est l’open data. Ils doivent définir leur sujet et ils sont parvenus à le faire.
Très rapidement l’administration Obama reprend l’open data. Avant lui, il n’y avait jamais eu de directeur des systèmes d’informations. Vivek Kundra est le premier CTO fédéral des États-Unis et ce n’est pas un hasard car c’est le premier à avoir ouvert les données d’une ville. Il était directeur des systèmes d’information de la ville de Washington en 2007 lors du premier concours open data (AppsForDemocracy).
Distingue-t-on des courants dans le mouvement d’ouverture des données ?
Il y a selon moi trois familles de l’open data à la française : libérale, libérale-libertaire et participative. Pleins de gens sont pour l’open data mais ils sont complètement antagonistes dans le futur souhaitable qu’ils nous décrivent.
« Il y a, dans l’idée même de cybernétique une croyance en la supériorité morale de l’ouverture par rapport à la fermeture. Mais jusqu’à quel point ont-ils raison ? »
Le principal mouvement libéral français actif sur le sujet est l’IFRAP, un think tank plutôt néolibéral, clairement anti-état. C’est une culture politique profondément anglo-saxonne qui est celle de la transparence pour mettre en lumière les dysfonctionnements des acteurs publics et proposer une alternative par le recours au marché.
Les libertaires font de la liberté de la circulation de l’information une valeur suprême et cardinale, ils sont pour une partie d’entre eux profondément inspirés par la cybernétique.
L’association française la plus structurée sur la branche participative est la FING, la Fondation Internet nouvelle génération : elle voit en l’open data un moyen de transformer une obligation légale en opportunité pour les territoires. C’est une posture de bienveillance vis à vis du rôle de l’état.
Si personnellement je m’inscris dans la tendance participative ce n’est pas parce que c’est la plus de gauche, mais parce que je pense que si on veut faire de la transparence, l’open data n’est pas le bon cheval, qu’il y a d’autres pistes plus prometteuses pour y parvenir. L’open data est aujourd’hui une démarche volontariste, et clairement les acteurs (publics ou privés d’ailleurs) ne choisissent pas par hasard les données qu’ils ouvrent. Donc cela reste mesuré par rapport à un objectif de transparence radicale.
Pourtant beaucoup de partisans de l’open data y voit un moyen d’aller vers plus de transparence… À ce titre que pensez-vous de la notion de data love (data must flow) prôné par Telecomix ?
Ce que j’ai vu dans le data love c’est l’idée de pousser à son paroxysme la notion de divulgation des données, par défaut tout devrait être mis en ligne et rendu accessible. L’un des principes affichés c’est « No man, machine or system shall interrupt the flow of data ». Cela me fait tiquer. Pour moi, ce sont les enfants perdus de la cybernétique.
Quand Norbert Wiener écrit Cybernetics, or Control and Communication in the Animal and the Machine en 1948, il est traumatisé d’un côté par Hiroshima et de l’autre côté par Auschwitz et il commence à définir les bases de l’utopie de la communication : tout ça ne serait jamais possible si l’information était libre.
« Quand on ouvre des data comme les horaires de bus, ce sont des données très intéressantes pour faire des applications, mais en matière de transparence cela n’apporte pas grand chose ! »
Il y a, dans l’idée même de cybernétique une croyance en la supériorité morale de l’ouverture par rapport à la fermeture. Mais jusqu’à quel point ont-ils raison ? Certes l’ouverture est devenue une valeur positive dans les pays occidentaux, mais de là à imaginer que parce que les données seraient toutes ouvertes le monde serait meilleur, c’est un peu naïf quand même. Je ne suis pas convaincu que l’open data soit le bon outil pour faire de la transparence. La vraie transparence c’est Wikileaks. Des données qu’on publie contre la volonté des acteurs concernés. Si on veut aller vers plus de transparence en France, il faut d’abord renforcer la loi CADA qui n’est pas du tout coercitive et dont l’application reste compliquée pour le commun des mortels. Si je veux obtenir une information (ou une donnée) qu’un acteur public ne veut pas me communiquer, il faut saisir la CADA pour qu’elle rende un avis. Si celui est positif mais que l’acteur refuse toujours de me fournir ce que je demande, alors je peux saisir le tribunal administratif. Autant dire que l’on est loin d’un véritable droit d’accès à l’information. Il ne faut pas confondre la transparence (transparence) et le fait de rendre des comptes (accountability).
D’autre part, je suis convaincu qu’on ne peut pas faire l’économie de se poser la question des effets de ce qui est divulgué. On n’est pas au pays des Bisounours, ouvrir des données est un acte rempli d’intentions. Bien évidemment, il y a un choix dans ce qui est publié et ce qui ne l’est pas ! Ce qui me dérange c’est la position qui consiste à dire que la transparence ce n’est plus une question politique. Beaucoup de mouvements se revendiquent de cet apolitisme. Je ne suis pas du tout d’accord, c’est éminemment politique.
Pourquoi les institutions publiques se lancent-elles dans l’open data ?
Il y en a qui savent pourquoi elles y vont et d’autres pas ! Globalement on ne peut pas dire que tout le monde ait un objectif clairement affiché. Pour moi, il y a deux grands objectifs : ceux qui y sont dans une optique de transparence et ceux qui y sont dans une optique de participation ou d’innovation. Dans une optique de transparence, le meilleur exemple, c’est Montebourg, alors président du conseil général de Saône-et-Loire (CG71), quand il présente sa plateforme open data où il parle de transparence : « il est tout à fait normal de travailler sous le regard public ». L’idée qu’on rende des comptes sous l’œil des citoyens est l’une des bases du système démocratique anglo-saxon. Le CG 71 a ouvert tout un tas de données, les effectifs des collèges, les fournisseurs, les budgets, mais une fois qu’elles ont été mises en ligne notamment via des interfaces de visualisation de données, cela ne va pas beaucoup plus loin ; que les gens viennent les voir ou pas, ce n’est plus du ressort de la puissance publique.
Alors que ceux qui sont dans une logique de participation sont dans l’idée de se dire « quelles sont les données qui vont donner lieu au plus de réutilisations ? ». Quand on ouvre des data comme les horaires de bus, ce sont des données très intéressantes pour faire des applications, mais en matière de transparence cela n’apporte pas grand chose !
À Rennes, cela fait un moment qu’ont été ouverts les budgets de la ville et les subventions aux associations, c’est une vraie démarche de transparence, mais personne ne s’est emparé de ces informations. Il y a un manque cruel sur le sujet d’implication de la part des médiateurs traditionnels. La presse se contrefout de ce genre de données, pourtant, il y aurait des choses à raconter.
On entend pourtant de plus en plus parler de data journalism…
Oui, on parle beaucoup du data journalism mais on le pratique peu, ce n’est pas une tradition française. En école de journalisme, on apprend plus le maniement de word que celui d’excel. Nous avons une tradition journalistique qui est de dire que les histoires sont liées à la source et à son traitement. L’idée que l’on puisse trouver une bonne histoire car on est capable de calculer une moyenne et une médiane dans un fichier excel, ce n’est pas rentré dans la tête de tout le monde. La question est aussi : est-ce que j’ai la capacité d’investir dans le data journalism ? Car faire une petite appli cela demande plusieurs compétences, du temps et cela va coûter plus cher qu’un article mais en terme de revenus publicitaires cela ne va pas générer beaucoup plus de pages lues.
Le principe de gratuité fait débat aujourd’hui, pourquoi ?
Il n’y a pas de meilleur prix que zéro. Cependant, rien ne nous empêche d’imaginer un système où les plus gros utilisateurs contribuent au coût de mise à disposition, pour les autres, c’est gratuit. Un exemple : Google Maps. Quand on intègre une petite carte Google dans un article c’est gratuit mais s’il s’agit du Parisien ou du Nouvel obs, où des milliers de requêtes sont faites à la journée, le service devient payant et c’est même assez cher. Le modèle n’est pas inintéressant car cela permet aux petits utilisateurs de rentrer dans le système. Les données ouvertes aujourd’hui sont gratuites car elles ne rapportaient rien aux collectivités. Le vrai business de la donnée ce n’est pas de la donnée ouverte pour l’instant.
Comment le citoyen peut-il se saisir de ces données ?
Par rapport au grand public, ce qui pose problème c’est « data » et non « open ». Qu’est-ce qu’une donnée ? Le grand public doit d’abord se familiariser avec cet objet. Le deuxième point important est qu’on n’attrape pas les mouches avec du vinaigre : si on veut parler de l’open data avec le grand public, il ne faut surtout pas parler d’open data ! Ce n’est pas un sujet grand public. On peut le regretter ou pas, moi je trouve ça normal. « Venez pendant deux heures on va parler d’open data », tout le monde fuit. Mais « venez on va parler du parc Thabor à Rennes, des prénoms des petits parisiens ou encore du montant de votre facture d’eau », là on accroche. Le sujet est un prétexte pour parler de l’open data. Est-ce que j’en fait des citoyens éclairés, je ne sais pas et je ne crois pas que mon ambition soit là.
Les sites gouvernementaux dédiés à l’open data sont-ils fréquentés ?
« C’est souvent en produisant soi-même de la donnée qu’on en comprend l’intérêt et les limites. »
Il y a eu un audit officiel sur le site anglais data.gov.uk : 82 % des gens qui arrivent sur le site en repartent sans avoir visité d’autres pages que la page d’accueil ! Dès lors : ou c’est un sujet qui n’intéresse pas les gens ou bien le site est hyper mal fichu. Mais encore une fois quel est l’objectif de l’open data ? Cela ne me choque pas qu’il y ait 82 % des internautes qui ne restent pas sur le site. En l’état actuel, cela ne s’adresse pas à tout le monde, il faut des médiateurs. Est-ce que dans les 18% qui restent, il y a des gens qui s’en sont emparés ou pas pour en faire des applications, des visualisations, proposer de nouveaux services ? C’est cela la vraie question.
Les données collaboratives ne sont-elles pas plus intéressantes pour le grand public ?
Oui ! Quand on veut passer à la culture de la donnée cela passe aussi par faire prendre conscience que tout le monde peut être producteurs de données. Dans les ateliers de sensibilisation, on commence plutôt par la donnée collaborative, on construit ensemble une base de données à partir d’un sujet qui sensibilise les participants. C’est souvent en produisant soi-même de la donnée qu’on en comprend l’intérêt et les limites.
Où en est-on en France sur l’ouverture des données ?
On n’est pas mal placé. Au niveau européen, il n’y a pas d’évaluation officielle, le programme ePsi Platform a publié de premiers résultats, on est n’est pas dans les tops premiers. On a la chance en France de combiner un open data des territoires (historiquement le premier) et une approche gouvernemental avec Etalab.
Peut-on imaginer que l’ouverture des données s’impose partout et à tous ? Quelle sont les limites de l’ouverture ?
Honnêtement, je n’en sais rien. Dans les pays anglo-saxons, l’idée d’ouverture et de partage des données se diffuse mais de là à dire que c’est la norme, ce n’est pas vrai du tout. La limite en France tient à une difficulté majeure : la loi définit ce qu’est une donnée public, les droits d’accès et de réutilisations mais aucune loi au monde ne définit ce que c’est une donnée ouverte (à de très rares exceptions près). Aujourd’hui on ne sait pas dire précisément ce qu’est une donnée ouverte.
Une autre limite qui est en train d’évoluer, c’est la frontière de la donnée ouverte avec les données personnelles. Le problème, à mon avis, c’est que cette frontière est en train de sauter sous l’effet conjugué de plusieurs approches. Il y a plusieurs mouvements qui consistent à dire que « la Cnil empêche de faire du business », c’est un raccourcis, mais dans l’idée, le Geonpi va dire ça. « La Cnil nous emmerde, nous contrôle tout le temps et nous empêche de stocker des données ; les gens utilisent Facebook, Twitter, donc en gros la messe est déjà dite » ! On n’a qu’à accepter de se régler sur la législation américaine ! Je ne trouve pas ça normal, cela m’embête profondément. (phrase supprimée) Il y a aussi une évolution du côté de la mouvance du « Rendez moi mes données personnelles », si quelqu’un sait quelque chose sur moi je veux aussi le savoir ! Il existe tout un tas de projets tels que MiData au Royaume-Uni (MesInfos en France) qui consiste à partager des données personnelles pour en reprendre le contrôle: SFR sait ça sur moi et bien j’accepte de partager une partie de ces données avec un tel ou un tel car cela va me permettre de mieux consommer. Jusqu’ici la position sur les données personnelles était claire et hors open data, là on en train d’ouvrir.
Quelles sont les oppositions récurrentes à l’open data ?
Pour Météo France ou l’IGN par exemple, c’est la fragilisation du modèle économique. Il faut donc reposer la question de financement de ces structures et ne pas leur imposer une part d’autofinancement. Quand on parle d’open data, la grosse crainte des institutions est : pour quoi faire ? L’open data consiste précisément à ne pas poser cette question. On n’est pas dans un contrôle a priori mais dans une modération a posteriori. C’est ce qui coince le plus. Les institutions craignent que leurs données ne soient pas bien comprises ou que l’on s’en servent contre elles.
Quelles difficultés se posent aujourd’hui au gouvernement français ?
« Singapour, c’est la preuve qu’on peut faire de l’open data sans ouverture politique. »
Quel est le rôle de l’état ? Que peut-on encore attendre de lui ? Doit-il se limiter à des fonctions régaliennes ou intervenir quand nécessaire ? Cette question est bien celle posée par l’open data, et elle n’est pas simple pour le gouvernement actuel. Lionel Jospin, le saint patron de l’open data en France, a déclaré le jour de la fermeture de l’usine Michelin en 2000 : « l’État ne peut pas tout ». En pleine campagne présidentielle, cela a été compris comme la démission de l’État. Mais il y a une autre manière de le comprendre : il y a une place pour la société civile, tout ne passe pas nécessairement par l’État ou le marché. Est-ce le rôle d’une collectivité de savoir construire les meilleures applis ou quoique je fasse, il y a des choses que je ne saurais pas mieux faire que des tiers ? Le rôle de l’État n’est-il pas plutôt celui d’un chef d’orchestre ?
Le débat sur l’open data concerne-t-il seulement les pays les plus développés ?
La banque mondiale est l’un des plus chauds partisans mais pas nécessairement dans une optique de participation mais plus de transparence. Dans pas mal de pays en développement, la problématique est la gouvernance et donc, si on obtenait une pratique de la transparence, on parviendrait à une meilleure gouvernance. Ce n’est pas faux et à la fois cela revient sur l’utopie cybernétique. Le contre exemple typique c’est Singapour qui a un super portail open data et tous les oripeaux de la modernité technologique.
Mais si l’open data est vraiment l’instrument de la démocratie, il faudrait expliquer pourquoi on peut faire de l’open data dans un pays où il n’y a pas eu d’élections avec plus d’un parti officiel depuis l’indépendance en 1965, où les rassemblements de plus de 5 personnes sont soumis à une autorisation préalable et où l’homosexualité n’est autorisée que depuis 5 ans ? Singapour, c’est la preuve qu’on peut faire de l’open data sans ouverture politique. On peut faire de l’open data et ne pas être un modèle démocratique !