Comprendre le Code INSEE de Rouen : Explication Détaillée

L'Institut National de la Statistique et des Études Économiques (INSEE) joue un rôle crucial dans la collecte et l'analyse des données socio-économiques en France. Pour faciliter ces analyses à un niveau infra-communal, notamment dans les zones urbaines comme Rouen, des systèmes de carroyage ont été développés. Cet article explore l'évolution et l'application du code INSEE à Rouen, en mettant en lumière les méthodes utilisées pour analyser les données à travers des grilles géométriques.

Qu'est ce qu'une API ? Ce qu'il faut absolument connaitre !

La Mise au Point du Système

Afin d'étudier les statistiques de l'INSEE à un niveau infra-communal pour les recensements de 1968 et 1975, l'Institut de Géographie de Rouen, en collaboration avec la Direction Régionale des Télécommunications, a envisagé au début des années 80 un système de reproduction cartographique automatique. Ce système devait résoudre le problème de la modification du découpage administratif entre deux dates de recensement, une modification souvent profonde en banlieue et qui peut intervenir exceptionnellement en centre-ville.

La Première Réalisation d'une Grille Géométrique

Pour réaliser cette étude d'évolution et dans un souci de parvenir à une collection de cartes des variables socio-économiques de l'INSEE dans un format réduit (21x29 cm), une grille géométrique fixe dans le temps a été mise en place pour l'ensemble de l'agglomération rouennaise.

La réalisation technique de cette grille a débuté par la création d'un fichier de correspondance qui relie les îlots aux deux dates de recensement et les cases de 750 m de côté constituant le cadre récepteur. La règle d'affectation de l'îlot à la case se caractérise alors par sa simplicité, mais également par son caractère arbitraire : l'unité géographique est rattachée à l'unité géométrique qui comprend au moins 50 % de sa surface. Sous sa forme initiale, la zone carroyée forme ainsi un rectangle de 15 km du sud au nord, et de 9,75 km d'ouest en est, centré sur la mairie de Rouen : elle constitue la première réalisation d’un carroyage sur la région rouennaise.

Le degré d'évolution des matériels informatiques et plus précisément des périphériques de sorties graphiques au début des années 80 explique à lui seul les limitations du système, notamment en ce qui concerne l'édition des carroyages. La figure ci-dessous illustre un problème rencontré fréquemment à cette époque : du fait de la configuration des imprimantes matricielles, le pavé graphique, nécessairement rectangulaire, déforme l'espace cartographié et nuit ainsi à la précision de l'étude géographique.

Lire aussi: Conseils comptabilité auto-entrepreneur

Rouen Vue Aérienne

Vue aérienne de Rouen.

Le Carroyage au Pas de 500 Mètres

La seconde réalisation d'une grille géométrique a débuté en 1984 dans le cadre d'une thèse de doctorat. Les objectifs de l'étude étaient désormais à la mesure d'un travail de thèse : l'analyse des évolutions demeurant une priorité, l'auteur considère le même espace pour les trois recensements de 1968, 1975 et 1982. Par ailleurs, un axe de recherche envisagé dès 1982 dans le carroyage initial est largement repris ; l'étude des interactions entre la ville, les espaces périurbains, et les zones rurales périphériques devient ainsi l'une des préoccupations majeures de l'auteur. Cette nouvelle problématique se traduit par une extension notable de l'aire d'étude qui passe de 150 km2 environ à 600 km2, en demeurant centrée sur l'hôtel de ville de Rouen. La grille géométrique couvre alors la quasi-totalité des communes qui déterminent l'agglomération rouennaise selon la définition INSEE de 1982, ainsi que de vastes zones rurales périphériques : elle forme ainsi un carré de 24,5 km de côté.

Afin de suivre les évolutions à l'échelle infra-communale, l'auteur détermine un pas de 500 m qui se révèle évidemment mieux adapté que le précédent pour l'étude des milieux intra-urbains, et parvient ainsi à une grille géométrique carrée de 2 401 cases (49x49, soit 24 cases de part et d'autre de la case centrale qui comprend l'hôtel de ville de Rouen). Cette définition réalise un compromis idéal entre les objectifs de l'étude et les moyens techniques mis en œuvre à l'époque (configurations matérielles, unités de stockage etc).

Mais l'amélioration majeure apportée au système réside moins dans le choix de la zone d'étude ou la définition de la grille que dans la méthode d'affectation elle-même des îlots aux cases du carroyage. En effet, dans la première expérience rouennaise, l'affectation d’un îlot à une case était fonction d’un seuil (plus de 50 % de la surface incluse dans la case), ce qui induisait de facto une approximation conséquente dans quelques cas particuliers (îlot à cheval sur deux cases).

La nouvelle méthode d'affectation se veut plus rigoureuse et repose sur l'évaluation précise de la contribution de chaque zone administrative à chacune des cases du carroyage. Ce gain important du point de vue de la rigueur mathématique du transfert de données spatiales d'un zonage vers un carroyage ne fut possible qu'au prix d'une chaîne de traitements complexes exposée maintenant.

Lire aussi: Code APE 8559A pour Auto-Entrepreneur Formateur : Le Guide

La Saisie des Fonds de Cartes Administratifs

L'étape initiale est la formalisation, sous forme numérique, des espaces géographiques sur lesquels ont été collectées les données. Parmi les deux types de numérisation existants (mode vecteur/mode point à point ou "raster"), c'est la numérisation en mode vecteur reposant sur la théorie des graphes qui fut employée, en raison de la longue expérience du groupe de recherche M.T.G. dans l'utilisation de cette technique. Les fonds de cartes administratifs ont été numérisés à partir d'un digitaliseur piloté par le module de saisie du logiciel de cartographie automatique "EdiCart".

Un problème technique est intervenu à ce stade : l'hétérogénéité des documents cartographiques utilisés était telle, qu'il est devenu impossible de les associer sans qu'apparaissent des chevauchements ou des vides entre les différents fonds de carte. La solution passant par la concaténation et la correction géométrique des 27 cartes au sein d'un référent spatial unique, un logiciel a été créé à cette occasion au sein du laboratoire ("TransCarto"), afin de parvenir à un fond de carte homogène associant les 27 fichiers corrigés, à la même échelle et au sein d'un repère commun. En fonction des différentes expériences de carroyage développées au sein du G.I.P. Reclus, c'est le repère "Lambert II" qui a été choisi comme cadre récepteur, la case centrale du carroyage rouennais étant située en 510-510,5 est, et 2494,5-2495 nord.

La Lecture des Données de Recensement

Une étape intermédiaire est nécessaire avant la lecture des données socio-démographiques et leur ventilation au sein du carroyage : la création de la table de correspondance reliant les zones géographiques contenant la statistique, et les individus géométriques stockés sous forme numérique. A l'aide du tableur Editabl, plusieurs index ont été créés sous forme de matrices, comprenant en ligne les individus géographiques identifiés par leur numéro de code INSEE (numéros de la commune, du quartier, et de l'îlot), et en colonne le numéro de la carte comprenant l’individu concerné, puis le numéro de la zone digitalisée au sein de la carte, correspondant in fine à cet individu.

La lecture des données s'est effectuée ensuite à l'aide d’un logiciel créé à cette occasion ("LitBande"). Cette opération associa la sélection des espaces compris dans l'étude au sein de l'ensemble des zones de Haute-Normandie (communes rurales et îlots), et la sélection des dix-sept variables choisies au sein de l'ensemble des variables disponibles à cette échelle.

Enfin, deux variables supplémentaires (emplois secondaires et tertiaires) tirées du Fichier des Grands Etablissements (F.G.E) sont venues allonger la liste des variables.

Lire aussi: Démographie de Maisons-Laffitte

Le Transfert du Zonage au Carroyage

Présentation du principe géométrique lié au transfert

La méthode employée pour le transfert des données de la carte choroplèthe vers le carroyage repose sur l'algorithme du "clipping" zonal. L'opération consiste à définir le polygone d'intersection existant entre une zone de forme quelconque et une fenêtre géométrique qui constitue dans l'expérience rouennaise la case du carroyage.

On tire de cette opération purement géométrique le principe de "contribution" d'une zone à un carreau, celle-ci constituant en fait le rapport de la surface du polygone intersecté sur la surface du polygone initial. Le résultat constitue donc un pourcentage qui peut être utilisé pour le transfert de mesures spatiales d'une carte choroplèthe vers un carroyage, dans le cas où l'on peut raisonnablement envisager une répartition uniforme du phénomène mesuré sur l’ensemble du polygone de départ, ce que l'on saisit intuitivement.

Soit X la contribution du polygone P au carreau C, et S une surface, on aura :

XP,C = SP′/SP avec P' = P ∩ C

Grille Géographique INSEE

Exemple de grille géographique infra-communale de l'INSEE.

Principes algorithmiques généraux liés à la ventilation

A partir du principe géométrique qui vient d'être exposé, un logiciel spécifique a été développé afin de procéder à la ventilation effective des 19 variables, du fond de carte administratif vers le carroyage ("VentileGrille"). Celui-ci constituait en fait un module particulier du logiciel de cartographie automatique EdiCart dans la mesure où l'ensemble des opérations géométriques réalisées dans VentileGrille s'effectuaient au sein de fichiers de "structure EdiCart".

Sur le principe de contribution, le logiciel devait donc traiter 3821 zones (pour le fond de carte de 1982), relativement aux 2401 cases (49x49) du carroyage au pas de 500 m. En fonction de ces nombres, il est apparu évident qu'un polygone ne contribuait qu'à un sous-ensemble très réduit des 2401 cases, et qu'il était donc inutile d'effectuer le "clipping" sur tous les carreaux pour chacun des 3821 polygones, ce qui aurait consommé un temps machine considérable. La solution d'optimisation retenue est passée par la détermination du rectangle circonscrit au polygone traité, à partir des coordonnées de ses sommets, ce rectangle délimitant tous les carreaux qui ont une intersection non vide avec le polygone, et seulement quelques carreaux aux intersections vides.

Cette optimisation ayant été intégrée au programme, l'algorithme simplifié est de la forme :

  1. Pour chacun des 3821 polygones
  2. Début
    • Calculer le rectangle circonscrit au polygone
    • Pour chacun des carreaux qui constituent le rectangle circonscrit
      • Calculer le polygone d'intersection entre le carreau et le polygone
      • Reventiler la variable associée au polygone en fonction de sa contribution au carreau (contribution exprimée sous la forme d'un pourcentage qui est le rapport "surface du polygone d'intersection/surface totale du polygone")
  3. Fin

A la fin du traitement, tous les carreaux du carroyage ont reçu une ou plusieurs contributions. Ainsi, le carreau (i,j) représente la somme des cinq contributions des polygones P, P1, P2, P3 et P4, et sa valeur R représente donc :

Avec NP = nombre de polygones aux intersections ≠ Ø

V = variable associée à un polygone

X = contribution d’un polygone au carreau

Sous sa forme actuelle, la banque de données par carroyage ressemble peu à sa précédente version au pas de 500 m, pour plusieurs raisons. Soulignons avant cela que la base cartographique du système est demeurée inchangée. En effet, les variables INSEE des trois derniers recensements ont été reventilées lors du transfert zonage-carroyage à partir des fonds de cartes digitalisés pour le carroyage au pas de 500 m, digitalisation qui a demandé plusieurs mois d’un travail long et minutieux. Par ailleurs, si une amélioration a été apportée à la technique du transfert des données zonales, l'algorithme général qui a été employé repose toujours sur la notion de contribution d'une zone à un carreau, par le biais du calcul du polygone d'intersection entre les deux objets géométriques.

Il s'agit donc au final d'une nouvelle version de la base de données par carroyage appliquée au Grand Rouen, et non pas d'un autre système. Dans cet esprit, l'aire d'étude est demeurée inchangée.

balises: #Insee

Articles populaires: