Nouveaux ensembles et normalisation des données

21 février 2014

Ensembles de données

À l’occasion de la Journée internationale des données ouvertes, les Bibliothèques de Montréal libèrent des statistiques sur le prêt, les collections et la fréquentation. Ce sont des tableaux basés sur les données extraites du système Millennium ILS. Cet ensemble de données enrichit celui du catalogue des bibliothèques qui est mis à jour mensuellement.

Récemment, les Archives de Montréal ont ajouté les plans détaillés de l’occupation du sol de 1949 à leur collection des années 1947-1949 : les plans généraux de l’occupation du sol de 1949 et les photographies aériennes de l’île de Montréal, 1947-1949.

Normalisation des données

L’équipe de soutien technique au catalogue CKAN a déposé les modules externes « Territoire » et « Export utilisateurs » dans le référentiel GitHub. Ils seront liés au répertoire du Government GitHub, une communauté d’échange et de collaboration.

Les responsables des portails de données ouvertes du Québec ont entrepris un vaste projet de normalisation afin d’améliorer la qualité des données libérées et en permettre une plus grande réutilisation. Les résultats préliminaires ainsi que les ébauches seront mis à l’épreuve dans les communautés d’utilisateurs lors d’échanges, d’ateliers et de concours.

Les chantiers

Des représentants du gouvernement du Québec et des villes de Montréal, Québec, Sherbrooke, Gatineau, Lévis, Longueil, Laval et Repentigny se concertent depuis le début de 2013 dans des chantiers. Ce groupe a convenu de débuter leur travail dans trois chantiers : 1) la licence ouverte commune, 2) la standardisation des données et 3) la normalisation des noms de champ d’ensembles de données.

Chantier : licence ouverte commune

La prolifération des licences ouvertes est un problème à la fois pour les utilisateurs et pour les administrations publiques. D’un côté l’interprétation de multiples licences est complexe en développement d’application, de l’autre, les administrations publiques doivent chacune adapter et faire valider les textes légaux par des juristes experts, puis faire reconnaître ces textes comme conformes à la définition des licences ouvertes.

Les municipalités et le gouvernement du Québec ont choisi d’adopter prochainement la récente licence ouverte internationale de Creative Commons 4.0 – paternité.

Chantier : standardisation des données

Cette démarche de standardisation vise entre autres l’interopérabilité afin d’ajouter le plus de valeur possible aux données libérées.

Le premier rapport préliminaire [ODT, DOCX] du groupe de travail sur la standardisation des données comporte les éléments suivants : les types de données; le référentiel spatial; l’encodage des fichiers; les formats de fichier supportés; la nomenclature; la standardisation de colonnes usuelles; les métadonnées; l’identifiant.

Chantier : normalisation des métadonnées (noms de champ) d’ensembles de données

Dans un premier temps, cinq ensembles de données ont été choisis pour normaliser les noms de champ en vue d’une mise à l’épreuve dans le cadre d’un concours, soit :

  • Les événements (mars 2014)
  • Les districts électoraux (mars 2014)
  • Le découpage administratif (mars 2014)
  • Les pistes cyclables (à déterminer)
  • Les bornes-fontaines (à déterminer)