La pandémie de Covid-19 a d’ailleurs donné à l’open data l’occasion de démontrer toute son utilité. Il est difficile de passer à côté de l’exemple récent de l’application CovidTracker, qui a rapidement été mise à la disposition des citoyens pour leur fournir une information fiable, pratique et digne de confiance. Pour reprendre les propos de Guillaume Rozier, créateur de CovidTracker, « l’open data peut changer nos vies ». En effet, l’ouverture des données publiques apparaît désormais comme une opportunité évidente pour créer de nouveaux services en prise directe avec les attentes de la population.
Ces « services publics augmentés », comme les appelle le gouvernement, constituent un axe prometteur d’innovation qui vient s’ajouter aux innombrables possibilités offertes par la donnée au secteur public. Cependant, pour que CovidTracker ne soit pas une réussite sans lendemain, les acteurs publics doivent lever les freins qui brident encore l’essor de l’open data.
Lever les freins à l'ouverture et au partage des données
Les faits sont clairs : l’ouverture des données n’a pas encore atteint un niveau satisfaisant en France. Selon le rapport de la mission Bothorel sur la politique publique de la donnée (Open Data) du 23 décembre 2020, la méthode qui a été utilisée est en cause. Le rapport fait état des freins suivants :
Le prétexte de la sécurité et de la conformité : la protection des données et le RGPD ne doivent pas être une excuse systématique pour éviter d’agir, mais un cadre précisant une manière respectueuse de le faire. La surprotection des données les rend indéchiffrables et inutilisables.
Une mise à disposition brouillonne des données : l’ouverture doit être plus large car encore trop d’administrations ne publient pas assez d’informations, ou mettent trop de temps à le faire. Par ailleurs, les données sont souvent de trop mauvaise qualité (publiées de manière éparpillée et sans cohérence, incomplètes, périmées, parsemées d’erreurs) pour être exploitables.
Un déficit d’explication : les données partagées sont trop souvent brutes, sans être accompagnées d’aucune facilité qui permettrait à un tiers de les comprendre et de les utiliser à bon escient. Ce manque d’accompagnement de la publication de la donnée, à la fois en termes de documentation et de contextualisation, est un frein important à son utilisation. Certaines administrations commencent cependant à publier des statistiques ou des open data sous forme « d’application » permettant une navigation contextuelle et intelligente dans les données.
Pour que l’open data porte ses fruits, les acteurs publics ne doivent donc pas se contenter de mettre en place des passerelles techniques. Il est indispensable de créer autour des données tout un environnement qui favorise leur exploitation. Pour porter tous ses fruits, l’open data ne doit pas être un simple principe technique, mais devenir un véritable service public de la donnée.
Faire de l’open data le levier d’innovation espéré
Les données en open data peuvent provenir de multiples sources et sur des sujets variés : recherche, santé, éducation, géographie, statistiques, économie, etc. Le but étant que ces données soient consultables librement, et réutilisables facilement, y compris à des fins commerciales. Tout cela pour une plus grande transparence des données, une meilleure coopération, une efficacité accrue de l’action publique, et la création de nouvelles opportunités pour le monde privé. Les bénéfices attendus comme les champs d’application sont multiples :
Une meilleure transparence des actions publiques : l’article 15 de la Déclaration des droits de l’homme et du citoyen de 1789 prévoit que « la société a le droit de demander compte à tout agent public de son administration ». Pour l’Etat, cela revêt un enjeu politique : en publiant des informations en open data, et ainsi en favorisant le droit d’accès aux informations publiques, l’Etat accroit le niveau de transparence et de visibilité de son action. La donnée devient un moyen pour évaluer objectivement et rigoureusement les actions publiques grâce aux statistiques notamment. L’open data devient alors un média comme un autre, à ajouter à la palette de communication utilisée par le gouvernement.
Améliorer les services apportés aux citoyens : la publication des données en open data aide aussi l’action des administrations grâce à la création de nouveaux services numériques. L’utilisation des données ouvertes permet notamment aux administrations d’améliorer l’efficacité des services aux citoyens, en partageant les informations avec d’autres services, partenaires ou entreprises privées. Un des objectifs avoués, par exemple par la Direction des Finances Publiques, est d’encourager la co-construction d’usages de ces données, d’animer un écosystème de « réutilisateurs ».
Favoriser l’économie : les bénéfices de l’open data sont aussi économiques, que ce soit pour l’institution publique elle-même, ou alors pour le secteur privé. La donnée est synonyme d’innovation. Selon l’étude « L’impact Économique de l’open data : Opportunités pour la création de valeur en Europe » publiée par l’European Data portal, les gains économiques liés à l’Open Data en Europe étaient estimés à 184 milliards d’euros pour l’année 2019 et pourraient atteindre 200 à 334 milliards d’euros d’ici 2025. Aussi le nombre d’emplois liés à l’open data en UE a dépassé́ 1 million à ce jour et pourrait atteindre 2 millions d’ici 2025.
Les données en open data sont avant tout des données et héritent donc des attributs et des besoins de gouvernance de n’importe quelles autres. Pour faire en sorte qu’elles ne soient pas seulement accessibles mais exploitables, il faut avoir à l’esprit ses potentiels utilisateurs externes. Cela nécessite la mise en place de trois ingrédients :
Une gouvernance avec des rôles clairement définis, depuis le CDO (Chief Data Officer), qui impulse et coordonne le programme, jusqu’aux propriétaires métiers des données et aux data engineers qui les maintiennent.
Des processus de gestion et de contrôle qui garantissent que la donnée est fiable, conforme et à jour, et qu’elle peut être diffusée en toute sécurité. Ayant vocation à être partagée, et en particulier à l’extérieur, avec un contrôle faible de son utilisation, l’open data nécessite un niveau extrême de qualité.
Un outillage qui facilite les opérations de recensement, de correction, d’enrichissement et de publication des données, et qui, surtout, permet de passer à l’échelle en éliminant les tâches les plus fastidieuses.
Ces questions et considérations sont autant de défis que le secteur public rencontre lorsqu’il met en œuvre sa politique de partage des données et d’open data. Il y a cependant une bonne nouvelle : la plupart de ces défis sont déjà adressés par de nombreux acteurs privés pour leurs données non-open et les outils ont maintenant une maturité suffisante pour la supporter et en faire un avantage compétitif.
Ces « services publics augmentés », comme les appelle le gouvernement, constituent un axe prometteur d’innovation qui vient s’ajouter aux innombrables possibilités offertes par la donnée au secteur public. Cependant, pour que CovidTracker ne soit pas une réussite sans lendemain, les acteurs publics doivent lever les freins qui brident encore l’essor de l’open data.
Lever les freins à l'ouverture et au partage des données
Les faits sont clairs : l’ouverture des données n’a pas encore atteint un niveau satisfaisant en France. Selon le rapport de la mission Bothorel sur la politique publique de la donnée (Open Data) du 23 décembre 2020, la méthode qui a été utilisée est en cause. Le rapport fait état des freins suivants :
Le prétexte de la sécurité et de la conformité : la protection des données et le RGPD ne doivent pas être une excuse systématique pour éviter d’agir, mais un cadre précisant une manière respectueuse de le faire. La surprotection des données les rend indéchiffrables et inutilisables.
Une mise à disposition brouillonne des données : l’ouverture doit être plus large car encore trop d’administrations ne publient pas assez d’informations, ou mettent trop de temps à le faire. Par ailleurs, les données sont souvent de trop mauvaise qualité (publiées de manière éparpillée et sans cohérence, incomplètes, périmées, parsemées d’erreurs) pour être exploitables.
Un déficit d’explication : les données partagées sont trop souvent brutes, sans être accompagnées d’aucune facilité qui permettrait à un tiers de les comprendre et de les utiliser à bon escient. Ce manque d’accompagnement de la publication de la donnée, à la fois en termes de documentation et de contextualisation, est un frein important à son utilisation. Certaines administrations commencent cependant à publier des statistiques ou des open data sous forme « d’application » permettant une navigation contextuelle et intelligente dans les données.
Pour que l’open data porte ses fruits, les acteurs publics ne doivent donc pas se contenter de mettre en place des passerelles techniques. Il est indispensable de créer autour des données tout un environnement qui favorise leur exploitation. Pour porter tous ses fruits, l’open data ne doit pas être un simple principe technique, mais devenir un véritable service public de la donnée.
Faire de l’open data le levier d’innovation espéré
Les données en open data peuvent provenir de multiples sources et sur des sujets variés : recherche, santé, éducation, géographie, statistiques, économie, etc. Le but étant que ces données soient consultables librement, et réutilisables facilement, y compris à des fins commerciales. Tout cela pour une plus grande transparence des données, une meilleure coopération, une efficacité accrue de l’action publique, et la création de nouvelles opportunités pour le monde privé. Les bénéfices attendus comme les champs d’application sont multiples :
Une meilleure transparence des actions publiques : l’article 15 de la Déclaration des droits de l’homme et du citoyen de 1789 prévoit que « la société a le droit de demander compte à tout agent public de son administration ». Pour l’Etat, cela revêt un enjeu politique : en publiant des informations en open data, et ainsi en favorisant le droit d’accès aux informations publiques, l’Etat accroit le niveau de transparence et de visibilité de son action. La donnée devient un moyen pour évaluer objectivement et rigoureusement les actions publiques grâce aux statistiques notamment. L’open data devient alors un média comme un autre, à ajouter à la palette de communication utilisée par le gouvernement.
Améliorer les services apportés aux citoyens : la publication des données en open data aide aussi l’action des administrations grâce à la création de nouveaux services numériques. L’utilisation des données ouvertes permet notamment aux administrations d’améliorer l’efficacité des services aux citoyens, en partageant les informations avec d’autres services, partenaires ou entreprises privées. Un des objectifs avoués, par exemple par la Direction des Finances Publiques, est d’encourager la co-construction d’usages de ces données, d’animer un écosystème de « réutilisateurs ».
Favoriser l’économie : les bénéfices de l’open data sont aussi économiques, que ce soit pour l’institution publique elle-même, ou alors pour le secteur privé. La donnée est synonyme d’innovation. Selon l’étude « L’impact Économique de l’open data : Opportunités pour la création de valeur en Europe » publiée par l’European Data portal, les gains économiques liés à l’Open Data en Europe étaient estimés à 184 milliards d’euros pour l’année 2019 et pourraient atteindre 200 à 334 milliards d’euros d’ici 2025. Aussi le nombre d’emplois liés à l’open data en UE a dépassé́ 1 million à ce jour et pourrait atteindre 2 millions d’ici 2025.
Les données en open data sont avant tout des données et héritent donc des attributs et des besoins de gouvernance de n’importe quelles autres. Pour faire en sorte qu’elles ne soient pas seulement accessibles mais exploitables, il faut avoir à l’esprit ses potentiels utilisateurs externes. Cela nécessite la mise en place de trois ingrédients :
Une gouvernance avec des rôles clairement définis, depuis le CDO (Chief Data Officer), qui impulse et coordonne le programme, jusqu’aux propriétaires métiers des données et aux data engineers qui les maintiennent.
Des processus de gestion et de contrôle qui garantissent que la donnée est fiable, conforme et à jour, et qu’elle peut être diffusée en toute sécurité. Ayant vocation à être partagée, et en particulier à l’extérieur, avec un contrôle faible de son utilisation, l’open data nécessite un niveau extrême de qualité.
Un outillage qui facilite les opérations de recensement, de correction, d’enrichissement et de publication des données, et qui, surtout, permet de passer à l’échelle en éliminant les tâches les plus fastidieuses.
Ces questions et considérations sont autant de défis que le secteur public rencontre lorsqu’il met en œuvre sa politique de partage des données et d’open data. Il y a cependant une bonne nouvelle : la plupart de ces défis sont déjà adressés par de nombreux acteurs privés pour leurs données non-open et les outils ont maintenant une maturité suffisante pour la supporter et en faire un avantage compétitif.
Autres articles
-
Informatica annonce un vaste programme d'innovations pour les solutions d'analyse et d’IA générative, basé sur AWS
-
Informatica apporte sa contribution aux mégatendances de Microsoft Azure (IA générative, Microsoft Fabric et format en tables de données ouvertes) avec de nouvelles fonctionnalités
-
Informatica annonce la disponibilité générale de CLAIRE-GPT basée sur la GenAI en Europe et dans la région Asie-Pacifique
-
Informatica met à disposition des blueprints pour simplifier et accélérer le développement d'IA générative sur les principales plateformes technologiques
-
Informatica s'associe à HowGood pour permettre à l'industrie alimentaire de prendre des décisions de développement durable basées sur des données et faciliter la conformité ESG