Que signifie le sigle INSEE : Définition et Rôle

L’Institut national de la statistique et des études économiques (INSEE) est un organisme français chargé du recensement et de la production de statistiques officielles. En France, comme ailleurs, le recensement est le premier pilier de la production de statistiques.

Régulier depuis le milieu du XIXe siècle avec un recensement tous les onze ou douze ans, il devient partiel et glissant en 2004, avec une cinquième de la population recensée chaque année. Le recensement permet d’établir la population légale du pays au 1er janvier de chaque année, différente de la population estimée : la population légale a deux années de décalage afin de traiter de façon exhaustive les données du recensement.

L’INSEE réalise également des enquêtes thématiques auprès de la population ou des entreprises, par exemple l’enquête « EVA » sur l’entrée dans la vie adulte en 2023. Outre les statistiques brutes, l’INSEE produit des zonages, c’est-à-dire la projection dans l’espace des données mesurées, utiles aux géographes. C’est lui qui définit si une commune est urbaine ou rurale, selon des critères qui ont beaucoup évolué depuis 1954 (définition de l’unité urbaine).

Logo de l'INSEE
Logo de l'INSEE

Le rôle des données

Le statisticien public utilise une matière première originale : les données. Il existe dans le monde de multiples sources de données, parfaitement ouvertes (open data), ouvertes sous condition (données accessibles aux chercheurs), via des conventions, ou bien payantes sous diverses formes. La notion de donnée est ainsi indissociable du concept auquel elle se réfère.

Une donnée peut être une valeur particulière d’une entité, d’un objet. Il s’agit d’un chantier, un séjour hospitalier, un lycée, à telle date, le nombre de buts marqués telle saison, le chiffre d’affaires telle année, etc. Les traits d’identification jouent un rôle particulier : les traits d’identification de l’individu, le métier : la ligne téléphonique, le compte bancaire, le compteur électrique.

Lire aussi: La TVA expliquée simplement

Revenons aux objets. Alors que le concept auquel on se réfère reste abstrait, le domaine oblige à aborder des considérations plus opérationnelles. Le domaine dépend de la nature de la valeur, de son type. La précision d’une date (année, jour, minute, seconde, nanoseconde). CSP est un code à deux chiffres, c’est sa nature. Ainsi, 21 > artisans.

Avec le troisième élément du triptyque, la valeur, on passe à une réalité plus tangible : de la chaîne de caractères, que l’on associe donc à un domaine et à un concept. Une précision s’impose ici : la valeur est associée au concept instancié, elle s’y réfère. Une telle conformité est fréquente grâce à des contrôles qui auront été effectués automatiquement sur la valeur, des contrôles de typage. Donc conforme, elle appartient à l’ensemble des valeurs admissibles.

Image de l'INSEE
Image illustrative de l'INSEE

Il existe de nombreuses possibilités pour recueillir des données, soit en tant que (méta)donnée, soit dans une documentation liée, sur le plan structurel et sur le plan sémantique. La qualité associée à cet ensemble de données est un critère de qualité. Leur existence résulte d’un besoin, elles sont imbriquées dans un environnement et parfaites, car elles sont intrinsèquement liées à un usage.

Une donnée signifie qu’il existe une preuve. Des éléments de carrière (feuilles de paie notamment) préparent un usage dans le cadre d’un processus de gestion. La qualité est la proximité à la supposée valeur vraie. Le travail du statisticien est plus facile grâce à des quantités considérables de valeurs (nombres, codes, libellés, dates, etc.), concept-domaine-valeur, et de caractériser la population couverte. Des conventions de notation se traduisent par un vaste ensemble de métadonnées.

Il n’existe pas de donnée dans la nature. Pas la moindre. En d’autres termes, les données ne sont pas données, il faut les construire, les prendre (captum vs datum). Dépendantes de choix eux-mêmes liés à des usages, les données nécessitent une longue expérience d’utilisation de données administratives. Le statisticien de fait, data scientist, utilise les métadonnées pour mieux s’en servir.

Lire aussi: Qu'est-ce qu'une subvention ?

Tableau récapitulatif des rôles de l'INSEE

Rôle Description
Recensement Établir la population légale du pays.
Enquêtes Réaliser des enquêtes thématiques auprès de la population et des entreprises.
Zonages Produire des zonages pour la projection spatiale des données.
Statistiques Produire des statistiques officielles pour divers domaines.

INSEE, INFLATION, IA (PARTIE 1) - Jean-Luc Tavernier (directeur de l'Insee) #stats #statistiques

Lire aussi: Comprendre la Franchise Auto

balises: #Insee

Articles populaires: