3 ans : politique données ouvertes

11 décembre 2018

Le 9 décembre 2015, il y a 3 ans, était adoptée la nouvelle mouture de la politique de données ouvertes de Montréal. Axée sur le modèle d’ouverture par défaut et tablant sur une gouvernance de données, cette politique renforçait le souhait de la Ville de rendre les données accessibles à tous pour plus de transparence, favoriser le développement économique basé sur l’économie du savoir et favoriser l’engagement citoyen avec les données comme base d’échange. Trois ans, dans le domaine des données, c’est beaucoup : à l’époque, l’apprentissage profond commençait à faire parler de lui, mais l’intelligence artificielle ne faisait pas la une des journaux. Petit retour en arrière et regard vers l’avenir.

Les efforts d’ouverture depuis 2015

Outre l’adoption de la politique, de nombreux gestes ont été posés. Premièrement, en matière de ressources humaines: deux postes supplémentaires furent créés pour les données ouvertes, créant ainsi une véritable équipe. Par ailleurs, une équipe responsable de l’analyse de données et des infrastructures de données a été mise en place au sein du Service des technologies de l’information : c’est un support inestimable pour rendre les données ouvertes.

Ces ressources ont permis de structurer la démarche de gestion et d’ouverture de données. Nous sommes donc passés d’une ouverture ad hoc, qui soulevait des enjeux de qualité et de maintenabilité des données à un processus documenté et structuré. L’ensemble de la démarche est désormais supporté par des mécanismes d’automatisation – développés durant l’année qui s’est écoulée, ces outils permettent de minimiser l’effort de mise à jour pour les fiduciaires de données.

Enfin, une démarche d’inventaire de données a été réalisée en 2017-2018. L’inventaire est une étape cruciale dans une gestion minutieuse des données, mais c’est également une démarche requérant un effort significatif : dans une organisation de 25 000 employés, des ensembles de données sont créés et mis à jour par des équipes très variées. L’inventaire a été publié le 2 mars 2018.

En terme de résultats

Depuis décembre 2015, le nombre d’ensembles de données ouvertes a augmenté significativement, passant de 189 à 320 et donnant l’évolution ci-dessous :

Graphique montrant l'évolution du nombre d'ensemble de données publiés sur le Portail de données ouvertes.

Bien que le nombre d’ensembles de données disponible soit un critère important, il faut également s’attarder sur d’autres éléments.

D’abord les chiffres absolus masquent le fait que plusieurs ensembles publiés avant 2015 ont nécessité d’être refait à cause d’une qualité insuffisante. Plusieurs ensembles ont également été fusionnés pour simplifier l’utilisation et l’accès.

Ensuite, un effort important a été mis pour augmenter la qualité des données produites. Une analyse plus approfondie avant publication est réalisée. Désormais, même pour des ensembles simples, il n’est pas rare de passer plusieurs heures à analyser le système source et les conditions de collecte de données pour s’assurer de publier une donnée reflétant la réalité du domaine considéré. L’automatisation des ouvertures des données puisées directement des systèmes de la Ville a d’ailleurs contribué significativement à l’amélioration de celles-ci.

La mise en place d’un processus plus structuré a également permis d’ouvrir des ensembles de données plus sensibles notamment pour des raisons de questions de protection de la vie privée comme les actes criminels, les demandes citoyennes auprès du service 311, les déclarations de punaises de lit et d’autres qui ont nécessité des dizaines d’heures de travail pour éviter que des individus puissent être ciblés par les données.

Le résultat est une baisse significative des demandes de correction ou des demandes d’explication sur les données publiées.

Au total, l’objectif d’augmentation du rythme d’ouverture n’a pas été atteint et l’objectif de publier l’ensemble des données “ouvrables” d’ici le 31 décembre 2018 n’est pas réaliste; toutefois la production est demeurée soutenue et est venue avec de nombreuses améliorations et des ensembles de données d’une complexité croissante.

En lien avec la communauté

La production des données n’est pas la seule raison d’être de l’équipe responsable des données ouvertes: un appui croissant auprès des utilisateurs est également nécessaire pour s’assurer que les données sont utilisées. À titre d’exemple, depuis la mise en place d’un outil de gestion des demandes en bonne et due forme, en janvier 2016, 2300 demandes, entrant par courriel ou médias sociaux, ont été traitées. Ces demandes vont de la demande d’ouverture, aux demandes d’aide pour utiliser certains ensembles de données complexes (les données 3D et LiDAR sont sûrement notre meilleur exemple) ou des signalements d’erreur nécessitant parfois de faire modifier les processus d’extraction des données. On parle ici du développement d’un nouveau service aux citoyens!

L’équipe s’implique également dans des événements, par exemple le Défi vélo MTL en novembre 2015 ou encore HackQc que Montréal a organisé en 2018. L’organisation d’événements est souvent demandée par la communauté et demeure des moments importants, mais requiert également des efforts importants.

Par ailleurs, Montréal joue également un rôle très actif dans l’écosystème québécois. En tant que membre “fondateur” de Données Québec, nous avons proposé de nombreuses bonnes pratiques et participons à plusieurs groupes de travail, par exemple sur une définition des ensembles de grande valeur. Là aussi, ce travail n’est pas visible, mais n’en demeure pas moins très important. Nous collaborons aussi activement auprès de partenaires tels que la STM, QDS, Bixi ou BTM pour assurer une cohésion dans les démarches de transparence des organismes montréalais.

Vers l’avenir

Le domaine des données ouvertes existe depuis plus d’une dizaine d’années, ce qui est en fait un domaine encore assez jeune. Plus encore, durant cette période, les données sont devenues un point focal de nombreuses discussions. Et même depuis 2015, la montée en puissance de l’intelligence artificielle a soulevé de nombreuses questions sur l’usage éthique des données.

Le domaine des données ouvertes ne peut pas rester insensible à ces évolutions.

Publier avec une intention

La dernière conférence internationale sur les données ouvertes a consacré une nouvelle tendance: publier avec une intention (publishing with purpose). Le but n’est pas de remplacer le concept d’ouverture par défaut (open by default) qui est enchâssé dans notre politique! Le but est d’orienter les efforts : travailler sur les données en réfléchissant aux besoins de la communauté et aux usages possibles. C’est intuitivement ce qui se faisait, mais les années à venir nécessiteront de travailler plus activement dans ce sens.

Ouvert à la conception

L’approche d’ouverture à la conception (open by design) repose sur l’intégration de la mécanique d’ouverture de données aux activités normales de production de données, notamment à même les systèmes technologiques. Les activités d’automatisation sont un élément structurant dans cet axe. Également, des clauses d’ouverture ou d’accès aux données dans les contrats de système ainsi que l’intégration de l’extraction de données aux conceptions de logiciel sont nécessaires selon cette philosophie, ce qui se fait de manière croissante.

Usage responsable des données

De nombreuses initiatives récentes soulèvent l’importance d’un usage responsable des données, par exemple Cities for digital rights ou la Déclaration de Montréal pour un développement responsable de l’intelligence artificielle. Ce ne sont pas des éléments spécifiques aux données ouvertes, mais ils doivent être intégrés dans la réflexion d’ouverture des données. Un rapport, réalisé récemment avec le CIRAIG, a permis de souligner quelques avenues de réflexion intéressantes dans le cadre des données obtenues par des capteurs (Internet des objets). Le travail des mois et années à venir devrait intégrer de manière croissante ces dimensions dans la réflexion entourant la publication des données.

Plan d’action en préparation et un portail amélioré

Afin de poursuivre l’amélioration de publication des données et prendre en compte le contexte changeant, un plan d’action est actuellement en préparation par l’équipe de données ouvertes. Ce plan d’action sera partagé en cours de 2019. En parallèle, des travaux sont également en cours pour offrir de nouvelles fonctionnalités sur le portail de données ouvertes. Nous vous invitons donc à nous suivre, à utiliser les données et échanger avec nous au besoin!