Quel suivi des usages des données ouvertes ? - data.gouv.fr (2024)

La réutilisation des données constitue l’un des principaux objectifs d’une politique d’ouverture des données publiques. Le référencement et l’étude de ces réutilisations sont donc essentiels pour mesurer l’impact de l’open data.

D’après le rapport “Pour une politique publique de la donnée, des algorithmes et des codes source” remis au Premier ministre par le député Eric Bothorel, «les acteurs publics ont aujourd’hui une faible connaissance des réutilisations permises [par les données ouvertes]» (p.7). Une réutilisation désigne communément l’exploitation de données ouvertes par des tiers, à d’autres fins que celle de la mission de service public pour laquelle elles ont été produites ou reçues. Elle peut prendre la forme d’une visualisation, d’une application, d’un article de presse, d’un papier de recherche, etc.

Le suivi des usages passe par leur mesure, au moyen de statistiques d’utilisation, mais implique également d’échanger avec les différentes parties prenantes pour une compréhension plus qualitative. Dans le cadre de ses travaux de mesure d’impact, notre équipe a donc entrepris d’interroger quelques producteurs de données et réutilisateurs. Nous vous proposons de vous partager les fruits de cette enquête.

Durant les cinq prochaines semaines, une série d’articles vous permettra de plonger au coeur des réutilisations de données ouvertes :

  • Quels enjeux autour de la connaissance des usages des données ouvertes ?
  • Comment suivre les usages ?
  • Quelle diversité d’usages ?
  • Quels exemples d’usage emblématiques ?

L’exploration démarre aujourd’hui avec une revue de quelques enjeux et bonnes pratiques autour du suivi des usages des données ouvertes. Ces différents enseignements ont été tirés de 8 entretiens réalisés avec des producteurs de données du service public de la donnée (SPD), considérés comme plus matures sur cette question. En effet, le service public de la donnée vise à mettre à disposition avec un haut niveau de qualité les jeux de données de référence qui présentent un fort impact économique et social. Ils sont alors beaucoup réutilisés pour créer de nouveaux produits et améliorer des services existants. Il ne s’agit pas ici de faire un bilan de ce service public de la donnée, mais de s’appuyer sur ce dernier pour exemple.

Sur le service public de la donnée, nos échanges avec les producteurs révèlent une attention et des efforts croissants pour appréhender les usages de leurs données ouvertes.

Pourquoi s’y intéressent-ils ? De quels leviers méthodologiques et techniques disposent-ils ? Quels sont leurs besoins en la matière ? Des réponses et des bonnes pratiques dans cet article.

Connaître les usages : pour quoi faire ?

Une analyse des usages permet aux producteurs sondés de développer une offre de données ouvertes plus pertinente, davantage adaptée à la demande. Deux mécanismes peuvent être à l’œuvre.

Améliorer la qualité des données

L’observation des utilisations faites et la remontée des besoins des réutilisateurs favorise tout d’abord l’amélioration de la qualité des données. En effet, pour une donnée, la notion de qualité (format, structure, contenu, mise à jour, métadonnées, documentation, etc.) dépend grandement de l’usage qui en est fait. Or, la qualité proposée, bien qu’adaptée aux utilisations internes à l’administration, peut être améliorée pour les usages nouveaux engendrés par l’ouverture. Pôle Emploi travaille ainsi étroitement avec la startup d’Etat DiagOriente pour améliorer le Répertoire Opérationnel des Métiers et des Emplois (ROME) en intégrant les retours des utilisateurs de l’outil (compétences pertinentes à retenir, celles qui sont renommées, jamais sélectionnées) et ses travaux de reformulation sémantique des compétences professionnelles.

Motiver la poursuite des efforts d’ouverture

De plus, la compréhension des usages permet de motiver la poursuite et le renforcement des efforts de mise à disposition. Les producteurs de données découvrent la valeur de leur travail de publication : les fichiers de gestion de l’administration qu’ils ouvrent deviennent un véritable matériel pour construire des services, des visualisations, des articles journalistiques, etc. “S’il y a des réutilisations qui demandent des téléchargements réguliers, nous pouvons anticiper les conséquences de ce type d’utilisation” indiquent les producteurs de la Base Sirene des entreprises. A un niveau plus stratégique, les producteurs de données peuvent aussi mobiliser cette connaissance sur les usages pour faire du reporting auprès de leur hiérarchie, démontrer le retour sur investissem*nt des efforts déployés et ainsi justifier la poursuite du travail engagé. Les producteurs de la Base Sirene des entreprises valorisent par exemple en interne la forte consommation des données, à l’aide d’un bilan mensuel qui reprend le nombre de requêtes et les principaux réutilisateurs.

Comment suivre les usages des données ouvertes ?

Les administrations interrogées combinent approches quantitatives et qualitatives pour cerner les usages de leurs données ouvertes.

La plupart commencent par mesurer les volumes d’usage, en suivant les métriques des jeux de données publiés proposées par data.gouv.fr ou sur leur propre portail. Nombre de téléchargements, nombre de réutilisations, etc., sont autant de chiffres qui offrent un premier aperçu de l’utilisation des données.

Pour préciser cette analyse, certains producteurs engagent également un dialogue avec les réutilisateurs et investiguent la nature des réutilisations. Selon le niveau de maturité et les moyens disponibles, plusieurs leviers sont disponibles :

  • Réponses aux commentaires et aux questions soumis sur data.gouv.fr, notamment sur la qualité des données : il s’agit par exemple d’un canal d’échange privilégié pour les producteurs du Répertoire National des Associations (RNA) qui compte 344 discussions sur la plateforme ;
  • Suivi des réutilisations ajoutées sur data.gouv.fr et incitation au référencement : la Base Adresse Nationale (BAN) recense notamment 43 réutilisations référencées sur la plateforme ;
  • Enquêtes auprès des réutilisateurs : les producteurs du Code Officiel Géographique (COG) ont par exemple lancé en 2019 une enquête qui a permis d’évaluer la satisfaction générale des réutilisateurs et de faire remonter des besoins en termes d’interopérabilité et de fréquence de mise à jour. Les producteurs de la Base Sirene mènent actuellement une démarche similaire et sondent leurs réutilisateurs sur des questions de contenu, de format ou encore de documentation des données ;
  • Animation de communautés de réutilisateurs, à l’instar de l’Institut National de l’Information Géographique et Forestière (IGN) qui organise un certain nombre d’événements mettant à l’honneur les réutilisateurs. Il propose également des conférences, des webinaires de prise en main des différents services ainsi que des tutoriels d’accompagnement ;
  • Entretiens avec les principaux réutilisateurs.

Les producteurs sondés indiquent aujourd’hui manquer de temps pour suivre les usages. Les leviers les plus frugaux, comme les questions soumises sur data.gouv.fr, ne permettent de collecter pour l’instant que peu de retours de la part des réutilisateurs.

Quels besoins exprimés par les producteurs de données et quelles opportunités pour data.gouv.fr ?

Des pistes d’amélioration produit pourraient pallier certaines de ces problématiques et simplifier le suivi des usages.

Les producteurs de données interrogés plébiscitent ainsi, sur data.gouv.fr :

  • Des métriques sur les jeux de données publiés (nombre de consultations, nombre de téléchargements, nombre de réutilisations, etc.)
    • plus lisibles et accessibles
    • communiquées régulièrement sous la forme d’un rapport partageable
      Il s’agit d’un sujet sur lequel l’équipe de data.gouv.fr va travailler très prochainement.
  • Des réutilisations
    • signalées au moment du référencement (notification)
    • décrites de façon plus détaillée par les réutilisateurs : utilisation et traitement des données, service rendu, profil du réutilisateur, etc.
  • Un forum de discussion qui favorise davantage d’échanges avec les réutilisateurs

Les administrations sollicitent également un support méthodologique associé à de l’accompagnement : aide à l’animation de communauté de réutilisateurs, partage de bonnes pratiques sur le suivi des usages, organisation d’échanges entre pairs, etc.

Producteurs de données, vous avez d’autres questions ou demandes concernant le suivi des usages de vos données ouvertes ? N’hésitez pas à nous contacter.

Réutilisateurs, comme explicité dans cet article, le référencement de vos travaux permet la mise en place d’un cercle vertueux qui favorise le développement de l’open data (montée en qualité des données, nouvelles ouvertures, etc.). Contribuez en publiant vos réutilisations sur data.gouv.fr !

Nous vous donnons rendez-vous la semaine prochaine pour entrer dans le vif du sujet et commencer à découvrir des réutilisations de données ouvertes. Notre tour d’horizon commencera par une présentation des usages développés au sein de l’administration.

Quel suivi des usages des données ouvertes ? - data.gouv.fr (2024)

FAQs

Quelles sont les données ouvertes ? ›

Les données ouvertes (de l'administration) sont les informations que les organismes publics recueillent, produisent ou achètent (aussi appelées «informations du secteur public») et qui sont mises à disposition gratuitement en vue de les réutiliser à d'autres fins.

Qui utilise les open data ? ›

Il s'agit de données auxquelles tout le monde peut accéder et que tout le monde peut utiliser et partager. Les gouvernements, les entreprises et les individus peuvent utiliser l'open data afin de créer des avantages sociaux, économiques et environnementaux.

Comment s'appelle le site de mise à disposition des données publiques françaises ? ›

Certaines de ces données sont désormais mises à disposition sur la plateforme internet data.gouv.fr, dans les conditions définies par la « Licence Ouverte / Open Licence ». Elles sont librement réutilisables.

Comment savoir si des données sont issues de l'open data ? ›

10 sites de référence de l'open data
  1. www.data.gov - la référence. ...
  2. data.gouv.fr - la version française. ...
  3. ouvert.canada.ca - les données publiques canadiennes. ...
  4. data.gov.uk - les données ouvertes du Royaume-Uni. ...
  5. data.europa.eu - l'Union Européenne.
Dec 16, 2019

Quel est l'objectif des données publiques ouvertes ? ›

L'objectif est de permettre aux citoyens de mieux contrôler l'administration afin de répondre aux enjeux démocratiques de notre société. Avec cette loi, l'information publique est considérée comme un bien commun, et doit donc par défaut devenir une donnée ouverte.

Quelles sont les données interdites sur l'open data ? ›

La règle générale est celle de l'interdiction de la publication des données personnelles ou nominatives. Il existe cependant des exceptions (liste des élus, résultats du bac, gîtes touristiques…). Par ailleurs, les données personnelles pour lesquelles les personnes ont donné leur accord peuvent être publiées.

Pourquoi mettre des données en libre usage pour tout le monde ? ›

La data en libre-service au sein de votre organisation

Cette démarche de démocratisation des données au sein de votre organisation permet également de développer l'autonomie des collaborateurs, de renforcer leur engagement et de mettre à profit leurs compétences.

Quels sont les formats open data ? ›

Formats de fichiers pris en charge
Format de fichierExtension de fichier
GéoJSON.json, .geojson
KML/KMZ.kml, .kmz
Shapefile.zip
Mapinfo.zip
8 more rows
Apr 16, 2024

Quel est l'objectif principal de l'open data ? ›

Les 3 objectifs de l'open data

l'amélioration de l'efficacité de l'action publique, la proposition de nouvelles ressources pour l'innovation économique et sociale par le partage de données entre réutilisateurs qui les intègrent dans de nouveaux services à forte valeur ajoutée économique ou sociale.

Quel est le rôle du site data gouv ? ›

data.gouv.fr est la plateforme ouverte et communautaire qui vise à centraliser et structurer les données ouvertes en France. Elle favorise la transparence et l'efficacité de l'action publique tout en facilitant la création de nouveaux services.

Quels sont les avantages de l'open data ? ›

En systématisant l'échange et le partage de données entre services et entre collectivités, l'open data réduit les délais d'accès et de traitement des informations, augmente l'efficacité des processus et au final, améliore le service public.

Qui a créé open data ? ›

Échelle de qualité des données ouvertes de Tim Berners-Lee

En 2010, Tim Berners-Lee a proposé une échelle de qualité des données ouvertes (de 1 à 5 étoiles). L'objectif premier était de mettre en ligne des données produites par l'État ou d'autres sans attendre la mise en œuvre d'une communauté d'intérêts privées (Cf.

Quelles sont les limites de l'open data ? ›

Les limites de l'Open Data

Certaines données ouvertes ont parfois un coût que les collectivités et les PME ne peuvent pas toujours assumer. Afin de pouvoir lire et utiliser la masse de données ouvertes sur internet, les entreprises ont en outre besoin d'un outil de data visualisation.

Quel est la différence entre big data et open data ? ›

Quelques points de divergence entre Big data et Open Data

Alors que le Big Data se détermine par son ampleur, l'Open Data se définit par son usage. De ce fait, l'ouverture des données représente une volonté de démocratiser l'information pour la rendre accessible au grand public.

Comment voir les données utilisées ? ›

Il faut aller dans les paramètres, puis dans “consommation des donnée” ou “utilisation des données”. De là vous pouvez voir votre consommation, mais aussi quelle application consomme le plus.

Quels sont les principaux types de données ? ›

Les données peuvent être divisées en 2 grandes catégories. Catégoriques et quantitatives. Les données catégories peuvent être subdivisées en données nominales et ordinales. Les données quantitatives peuvent être discrète ou continue et sont aussi appelées données numériques.

Quel fichier en open data ? ›

Un format recommandé par le W3C est le RDF, car il permet de représenter les données sous une forme qui rend la combinaison de données de différentes sources plus facile. Les données RDF peuvent être stockées, parmi d'autres formats, en XML et JSON.

C'est quoi des fichiers de données libres d'utilisation ? ›

Ce sont des données numériques produites par les acteurs publics et privés, diffusées de manière structurée selon une licence ouverte garantissant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière.

Top Articles
Latest Posts
Article information

Author: Margart Wisoky

Last Updated:

Views: 6072

Rating: 4.8 / 5 (78 voted)

Reviews: 93% of readers found this page helpful

Author information

Name: Margart Wisoky

Birthday: 1993-05-13

Address: 2113 Abernathy Knoll, New Tamerafurt, CT 66893-2169

Phone: +25815234346805

Job: Central Developer

Hobby: Machining, Pottery, Rafting, Cosplaying, Jogging, Taekwondo, Scouting

Introduction: My name is Margart Wisoky, I am a gorgeous, shiny, successful, beautiful, adventurous, excited, pleasant person who loves writing and wants to share my knowledge and understanding with you.