Vers une meilleure gouvernance des données: des exemples concrets de réussite

by Naysan Saran

L’article original peut être lu ici

Since the Sumerians of the fourth millennium BCE, governments have kept records. These records  have, of course, evolved from a few hundred cuneiform symbols engraved on clay tablets to terabytes of data hosted on cloud servers. However, their primary goal remains the same: to improve land management.

That being said, the six thousand years of civilization separating us from the Sumerians has seen the birth of democracy, and with that birth, a second goal has been grafted onto the first: cities must now earn the trust of their citizens with respect to how they manage those citizens’ data. This goal cannot be achieved without good data governance, which defines strategies for the efficient and transparent use and distribution of information.

To learn more about the state of the art in municipal data management, both internally and externally, we went to meet with two experts who agreed to share their experiences and best practices: François Robitaille, business architect for the city of Laval; and Adrienne Schmoeker, former Deputy Chief Analytics Officer for the City of New York, and Director at the New York City Mayor’s Office of Data Analytics where she managed the Open Data Program for three years.

Optimizing the Management of the City’s Internal Data: The Case of Laval

Liste lexicale néo-assyrienne de noms de pierres sur une tablette d’argile. © Trustees of the British Museum

    Au sujet de la gestion de données municipales, nous avons interviewé François Robitaille, architecte d’affaires à la Ville de Laval. Fort de plus de vingt ans d’expérience en conception d’architectures de données, en géomatique, en intelligence d’affaires et en contrôle de qualité de l’information, M. Robitaille travaille présentement à la migration du système de données de la troisième ville du Québec dans le Cloud Azure. Ce travail fait partie d’un effort mené par la ville de Laval pour mettre en place une stratégie de gouvernance de données basée sur les meilleures pratiques et les nouvelles approches technologiques. 

    Ses recommandations se déclinent en trois axes:

    Établir une gouvernance des données
    Cartographier le cycle de vie des données impliquées
    Mettre en place des règles de contribution durables

    Établir une gouvernance des données

    A partir du moment où une municipalité atteint une certaine taille critique, la gestion des données devient un effort collectif. Par exemple, l’information relative à une conduite d’eau peut être modifiée à la fois par la Géomatique, le Génie, et les Travaux Publics. À ce stade, la situation à éviter à tout prix est d’avoir des bases de données dupliquées, éparpillées dans chaque département, qui évoluent en parallèle mais différemment, jusqu’à perdre tout espoir de les réconcilier.

    Pour assurer la cohérence des données, primordiale à une gestion saine de l’information, la Ville doit mettre en place un processus dont le but est de contrôler, d’une part, qui peut contribuer aux données, et d’autre part, comment le faire.

    “Ce ne sont pas juste des outils technologiques dont on a besoin à ce niveau. La donnée ne peut pas venir de partout. Il faut mettre en place des processus d’affaires qui sont clairs, avec des points d’entrées connus, et des sorties standardisées. Au Québec, par exemple, plusieurs municipalités ont collaboré au projet Gocité afin de mettre en place un modèle de données normalisé permettant de garantir l’intégrité de leurs données à travers différentes applications.”  — François Robitaille, architecte d’affaires, solutions de géomatique, Ville de Laval

    Figure 1: Schéma simplifié du cycle de vie d’une donnée de conduite d’eau potable

    Cartographier le cycle de vie des données impliquées

    Ensuite, il faut réaliser qu’une donnée est plus vivante qu’on ne le pense. Elle est créée, évolue, puis finit par mourir, et tout ce processus – que l’on appelle cycle de vie de la donnée – doit être bien compris. Le schéma ci-dessous illustre, bien que de manière simplifiée, celui d’une conduite d’eau potable.

    “D’ailleurs, ce n’est pas parce que la conduite finit par être détruite qu’il faut effacer la donnée qui y était associée”, explique l’architecte d’affaires, “Car il est fort probable que, dans quelques années, on vous demande de justifier une décision prise par votre département dans le passé. Comment allez-vous y arriver si l’information nécessaire à expliquer la décision n’existe plus?”

    Mettre en place des règles de contribution durables

    Finalement, nous avons demandé à M. Robitaille de nous présenter quelques exemples concrets de situations à éviter, ainsi que les meilleures pratiques à adopter dans chacun des cas.

    Éviter les architecture Point à Point

    Ici, le schéma typique que l’on souhaite éviter est malheureusement bien connu: on débute par système de géomatique comme ArcGIS qui est connecté directement sur la base de données d’un système métier. Peu après, un autre système expert vient se connecter au premier système métier, et ainsi de suite. On se retrouve rapidement un “spaghetti” de connections qui devient ingérable.

    Une meilleure solution serait de bâtir un dépôt de données partagées, centralisé, et auquel chaque service peut contribuer à travers une interface sécurisée. Le but de cette interface est à la fois d’informer les autres systèmes métiers de tout changement effectué sur des informations partagées, tout en régulant les droits d’accès – d’où l’importance d’avoir établi une gouvernance des données au préalable.

    Créer un modèle de données souple permettant des usages variés

    Un autre écueil à surmonter : comment réconcilier besoins opérationnels de chaque département – par définition spécifiques – et nécessité d’uniformité de la “Ville”, qui reste propriétaire des données.

    Une des solutions privilégiées est l’établissement de comités directeurs avec les participants de tous les services, afin de s’accorder sur un modèle suffisamment souple pour permettre son utilisation par plusieurs domaines d’affaires différents et la distribution des données selon les besoins de chacun (fréquence, format…).

    Une gestion réussie des données ouvertes: l’exemple de New York

    Open Data Week est organisé et produit par le NYC Open Data Program et BetaNYC. Cette série d’événements d’une semaine a lieu pendant la première semaine de mars pour célébrer la loi sur les données ouvertes de la ville de New York, qui a été promulguée le 7 mars 2012, et la Journée internationale des données ouvertes qui a lieu généralement le premier samedi de mars.”

    Pour gagner la confiance des citoyens, la gouvernance des données doit aussi considérer celles qui sont partagées avec le public. À ce niveau, l’un des meilleurs exemples provient des États Unis.

    En 2017, lorsque Adrienne Schmoeker a entamé son mandat comme Directrice de l’engagement civique et de la stratégie au New York City Mayor’s Office of Data Analytics, la situation était loin d’être optimale. En effet, l’organisation recevait régulièrement des plaintes provenant d’usagers, et pour cause: ceux-ci envoyaient de nombreuses requêtes d’accès à l’information, requêtes qui restaient très souvent sans réponse.

    Deux ans plus tard, le plus grand programme municipal de données ouvertes des États-Unis voyait le jour, avec 2 500 jeux de données publiés par 100 agences et organisations de la Ville. Mieux encore, une loi a été votée concernant le service à la clientèle et limitant les délais de réponse aux usagers à un maximum de deux semaines. Pour en savoir plus sur cette réussite qui laisse admiratif, nous avons interviewé Mme Schmoeker sur les clés de son succès.

    Ne pas négliger l’aspect politique

    “Aujourd’hui, si vous envoyez une requête au service de données ouvertes de New York, le département en question doit faire un audit pour rechercher dans l’ensemble de données dont il dispose, si celles que vous demandez sont disponibles.”, explique l’experte en Open Data.

    Toutefois, ce résultat hors du commun n’aurait pas été possible sans l’implication des élus: “Il faut savoir qu’en 2012, la Ville de New York a passé une loi stipulant que toutes les données devraient être rendues publiques au plus tard en Décembre 2017. Sans cette loi, le programme de données ouvertes ne serait pas là où il en est aujourd’hui.”

    En effet, l’adoption de ce genre de réglementation est instrumentale pour faire bouger les choses, car les employés municipaux sont souvent très occupés. “Lorsque quelqu’un reçoit un courriel du bureau exécutif de la Ville, dont le sujet est: ‘You are out of compliance’, vous avez beaucoup plus de chances d’obtenir son attention que si le courriel s’intitulait ‘Une ONG locale a besoin de vos données’”.

    Malheureusement, faire voter des lois qui rendent obligatoire le partage des données reste très délicat et relève surtout de la stratégie politique: il faut savoir que la Open Data Law de 2012 a été votée à la fin de l’administration Bloomberg … Bien plus facile, en effet, de faire passer un décret si c’est la prochaine administration qui doit se charger de le mettre en place.

    Adresser la question de la confidentialité des données

    Ensuite, force est de constater que certaines données sont plus sensibles que d’autres. Comme l’écrit Carol Stimmel dans “Building Smart Cities”, votre rêve de plateforme digitale constitue probablement, pour certains de vos collègues, un cauchemar au niveau de la confidentialité. Par exemple, à la Ville de New York, certains départements ont hésité à publier leurs données pour des raisons de sécurité. “Les causes de ce genre de résistance sont parfois légitimes”, explique Mme Schmoeker, “C’est pourquoi il faut prendre le temps d’identifier, avec chaque service, les risques réels qui pourraient découler du partage de leurs données, et décider en conséquence”.

    Gérer vos données comme vous gérez vos actifs

    Un des aspects clés de la loi de 2012 concerne la gouvernance des données: chaque année, la Ville de New York doit désormais publier un rapport sur les données disponibles, et désigner une personne chargée des données ouvertes dans chaque agence municipale. Ces “champions locaux” seront clés dans votre stratégie de données ouvertes.

    “Une fois que vous avez votre liste de champions dans chaque département, votre travail devient plus efficace. Communiquez avec eux en dehors des rapports annuels. Sondez-les, demandez-leur quelles sont leurs difficultés, s’ il y a des formations qu’ils aimeraient suivre, etc. Organisez des rencontres pour leur faire sentir qu’ils font partie de quelque chose de plus grand, faites-leur réaliser qu’il y a une communauté de citoyens qui ont besoin de ces données, et pour qui leur travail a un impact réel.” — Adrienne Schmoeker, ancienne Deputy Chief Analytics Officer de la ville de New York, Conseillère à Urban AI, Senior Fellow du GovLab au NYU Tandon and City Engagement Strategist & Conseillère à Helpful Places, stewards of the DTPR Standard

     

     

    Par où commencer?

    Au final, le défi des données ouvertes s’apparente à la recherche d’un équilibre entre l’offre et la demande. Pour savoir par où commencer pour atteindre cet équilibre, Mme Schmoeker conseille d’identifier les priorités en répondant aux questions suivantes:

    • À l’interne: quels jeux de données sont les plus simples à publier?
    • À l’externe: quels organismes non gouvernementaux ont besoin de ces données

    “Rassemblez les données en fonction de la demande, et ensuite, utilisez-les de manière stratégique pour appliquer la pression afin de publier ces données. Trouvez des moyens d’impliquer la communauté: organisez des assemblées de citoyens, des ateliers sur la littératie des données, etc. Réfléchissez au type de données que les gens souhaiteraient avoir.”

    En conclusion

    En 2014, Michael Bloomberg écrivait “Le meilleur moyen d’améliorer la vie de milliards de personnes à travers le monde est d’améliorer le fonctionnement des villes”. Et pour cause: pour la première fois dans l’Histoire, la majorité de la population mondiale habite en zone urbaine; en 2050, trois humains sur quatre seront citadins.

    L’ancienne manière de gérer les données – à travers des départements travaillant en silos et protégeant jalousement leurs informations – touche à sa fin car il ne répond plus aux besoins des citoyens. Pour le remplacer, il sera nécessaire de miser, non seulement sur des outils technologiques adaptés, mais aussi sur une gouvernance des données qui implique toutes les parties prenantes, à la fois à l’intérieur et à l’extérieur de l’hôtel de ville.

    Leveraging artificial intelligence and machine learning to help protect the world’s most valuable resource, Water.

    © 2020 CANN Forecast Software Inc.

    FOLLOW US