code | nom |
---|---|
FR-ARA | Auvergne-Rhône-Alpes |
FR-BFC | Bourgogne-Franche-Comté |
FR-BRE | Bretagne |
FR-CVL | Centre-Val de Loire |
FR-COR | Corse |
FR-GES | Grand Est |
FR-HDF | Hauts-de-France |
FR-IDF | Île-de-France |
FR-NOR | Normandie |
FR-NAQ | Nouvelle-Aquitaine |
FR-OCC | Occitanie |
FR-PDL | Pays de la Loire |
FR-PAC | Provence-Alpes-Côte d’Azur |
Introduction
Ce document permet d’aider un gestionnaire de Système d’Information (SI) à décrire son domaine dans un fichier de configuration. Lorsque l’on dépose ce fichier dans l’application, cela crée un schéma dans la base de données ainsi que les outils permettant de l’alimenter et de la consulter. Chaque fichier de configuration déposé générera un schéma dédié dans la base de données.
Préalable
Avant de commencer l’écriture du fichier de configuration, il vous faut travailler à définir le modèle des données que vous voulez traiter dans la base de données.
Vous avez en votre possession un certain nombre de fichiers (format CSV) contenant les données. Un fichier de données respecte un certain format. En particulier, les en-têtes de colonnes doivent être fixés et le contenu sous un en-tête a un format déterminé (date, valeur flottante, entier, texte…).
Chaque format de fichier correspond à ce que l’on appellera un type de données. Il regroupe plusieurs variables correspondant à :
- une thématique,
- un pas de temps,
- une structuration des données,
- …
Chaque ligne peut être identifiée par un sous-ensemble de colonnes. Cet identifiant permet de créer ou de mettre à jour une donnée, selon qu’elle est ou non déjà présente en base.
Chaque ligne peut porter, sur une ou plusieurs colonnes, une information de temporalité.
Chaque ligne peut porter aussi, sur une ou plusieurs colonnes, des informations sur le contexte d’acquisition des variables des autres colonnes.
On peut vouloir aussi faire figurer dans la base de données certaines informations non présentes dans le fichier de données :
- des informations liées aux variables que l’on fournit sous la forme de fichiers de référentiels (description de site, description de méthodes, description d’unités, description d’outils…),
- des informations constantes, ne dépendant pas du fichier (par exemple l’unité de la variable),
- des informations constantes pour l’ensemble du fichier (par exemple le site correspondant aux valeurs du fichier). Ces informations peuvent être décrites dans un cartouche, avant l’en-tête de colonne ou juste sous l’en-tête de colonne (valeur minimum ou maximum),
- des informations calculées à partir d’informations du fichier, d’informations des référentiels déjà déposés ou même des données déjà publiées.
Exemple
Supposons que l’on ait un fichier de données météorologiques :
Région;FR-CVL;;;;
Période;06/2004;;;;
Date de mesure;Site;Précipitation;Température moyenne;Température minimale;Température maximale
01/06/2004;Os1;30;20;10;24
07/06/2004;Os1;2;22;14;27
07/06/2004;Os2;0;21;9;28
- La temporalité est portée par la colonne “Date de mesure”.
- Le contexte est porté par l’information du cartouche d’en-tête “Région” et la colonne “Site”.
On identifie :
- une composante date au format dd/MM/yyyy (format au sens SQL : https://www.postgresql.org/docs/current/functions-formatting.html#FUNCTIONS-FORMATTING-DATETIME-TABLE). On note que les moyennes sont calculées à la journée.
- deux composantes localization qui font référence à un site de la colonne “Site”, avec deux composantes (site et région)
- deux composantes precipitation qui correspondent à la pluviométrie de la colonne “Précipitation” (value, unit=mm)
- 4 composantes (value, min, max, unit=°C) temperature qui se réfèrent aux colonnes “Température moyenne”, “Température minimale” et “Température maximale”
Du coup, on peut aussi définir des référentiels pour préciser ces informations :
nom | Date.de.création | region |
---|---|---|
Os1 | 01/01/2000 | FR-CVL |
Os2 | 01/01/2000 | FR-CVL |
Les sites font référence aux régions.
nom | nom_fr | nom_en | code |
---|---|---|---|
temperature | Température | Temperature | °C |
precipitation | Précipitation | Precipitation | mm |
Le fait de dire que l’unité d’une donnée fait référence au référentiel unité signifie :
que l’unité doit être présente dans ce référentiel,
que l’on ne pourra pas supprimer une unité du référentiel si on y a fait référence.
On aurait pu rajouter des responsables de site et de région, des descriptions des variables, des intervalles de valeurs…
Ainsi nous avons pu faire une analyse de notre domaine et le format des fichiers qui s’y rapportent. Nous pouvons commencer l’écriture du fichier de configuration.