Insee c’est quoi et comment accéder gratuitement à toutes ses données ?

L’Insee, Institut national de la statistique et des études économiques, est l’organisme public français chargé de produire les statistiques officielles sur la population, l’économie et les territoires. Créé en 1946 au sein du ministère des Finances, il alimente le débat public avec des données librement accessibles. Mais entre la page d’accueil du site insee.fr et l’extraction d’une série de données exploitable dans un tableur, le parcours reste flou pour la plupart des usagers.

Insee : un producteur de données, pas seulement un site web

Réduire l’Insee à son site internet serait passer à côté de son rôle structurel. L’institut produit le recensement de la population, calcule l’indice des prix à la consommation, gère le répertoire Sirene des entreprises et publie les comptes nationaux, entre autres missions.

A lire aussi : Trouver un emploi à Dinan : conseils, annonces et ressources

Ces productions alimentent des décisions concrètes : revalorisation du SMIC, ajustement des loyers, politiques d’aménagement du territoire. Les collectivités locales, les chercheurs, les journalistes et les entreprises y puisent des informations de référence.

Le répertoire Sirene, qui recense les entreprises et leurs établissements avec leur numéro Siren, fait partie des jeux de données dont la diffusion est ouverte et gratuite. Cette ouverture, documentée depuis le début des années 2000, s’inscrit dans une logique d’open data que l’institut a progressivement étendue à d’autres bases.

A lire également : Toutes les solutions pour contacter le site Le Bon Coin facilement

Homme consultant le site officiel de l'Insee sur un ordinateur de bureau à domicile pour accéder aux données publiques

Du grand public à la donnée brute : le parcours concret sur insee.fr

Le site de l’Insee propose plusieurs niveaux de lecture. Les pages éditoriales (analyses, études, publications) s’adressent à un public large. Les tableaux de données détaillés, eux, répondent aux besoins des utilisateurs qui cherchent des chiffres précis sur une commune, un secteur d’activité ou une période donnée.

Le passage d’un niveau à l’autre se fait via la rubrique « Statistiques » du site. Chaque thème (population, emploi, revenus, entreprises) donne accès à des tableaux téléchargeables, souvent au format CSV ou Excel. Pour un usage ponctuel, ce chemin suffit.

La difficulté apparaît quand on veut automatiser la récupération de données, par exemple pour alimenter un tableau de bord mensuel ou un script d’analyse. C’est là qu’intervient la Banque de données macroéconomiques, la BDM, et son service d’accès programmatique.

Accéder aux données Insee depuis Excel ou R sans maîtriser le jargon technique

L’Insee met à disposition un service web fondé sur le protocole SDMX (Statistical Data and Metadata eXchange). Ce terme peut rebuter, mais le principe est plus simple qu’il n’y paraît : on construit une adresse URL qui décrit les données souhaitées, et le service renvoie un fichier structuré.

Trouver l’identifiant d’une série sans connaître le catalogue

Chaque série statistique de la BDM possède un identifiant appelé idbank. Pour le trouver sans fouiller la documentation technique, la méthode la plus directe consiste à passer par les tableaux de données du site insee.fr. Sous chaque tableau, un lien permet d’afficher les séries associées et leurs identifiants.

Une fois cet identifiant copié, il suffit de le coller dans l’URL du service web pour récupérer la série correspondante. Le service accepte jusqu’à 400 séries par requête, ce qui permet de constituer des extractions conséquentes en un seul appel.

Intégrer les données dans Excel ou un script R

Pour Excel, la fonction « Données depuis le web » (Power Query) accepte directement l’URL du service SDMX. Le fichier renvoyé se transforme en tableau sans manipulation supplémentaire. La mise à jour se fait en rafraîchissant la requête.

Pour R, plusieurs packages existent. L’URL du service web se passe en paramètre, et les données arrivent sous forme de dataframe. Les paramètres de requête permettent de limiter la période ou le nombre d’observations renvoyées, ce qui évite de télécharger des historiques complets quand seul le dernier trimestre est utile.

  • Repérer la série sur insee.fr et noter son idbank dans le tableau de données associé
  • Construire l’URL du service SDMX en y insérant cet identifiant
  • Coller cette URL dans Power Query (Excel) ou dans un appel HTTP (R, Python, SAS)
  • Ajuster les paramètres de date pour ne récupérer que la tranche nécessaire

Ce parcours en quatre étapes ne demande aucune connaissance préalable du protocole SDMX ni de son vocabulaire technique. Le seul prérequis est de savoir quel indicateur on cherche, ce que la navigation sur le site permet de clarifier.

Deux collègues analysant une carte démographique et des statistiques régionales de l'Insee lors d'une réunion professionnelle

Sirene, données locales, fichiers détail : les autres portes d’entrée gratuites

Le service SDMX couvre les séries macroéconomiques, mais l’Insee diffuse aussi des données à d’autres échelles. Le répertoire Sirene, par exemple, est accessible via une API dédiée qui permet de rechercher une entreprise par son numéro Siren, sa dénomination ou son activité juridique.

Les données locales (dossier complet par commune, intercommunalité ou département) sont téléchargeables directement depuis la rubrique correspondante du site. Ces fichiers couvrent la démographie, le logement, l’emploi ou les revenus à une maille fine.

  • Le répertoire Sirene : informations sur les entreprises (numéro Siren, activité, forme juridique, date de création)
  • Les fichiers détail du recensement : données individuelles anonymisées, exploitables pour des analyses statistiques poussées
  • Les données locales : tableaux prêts à l’emploi pour chaque territoire

L’ensemble de ces ressources est en accès libre, sans inscription pour la consultation, et sans frais pour le téléchargement.

Les limites à connaître avant de se lancer

L’accès gratuit ne signifie pas que tout soit immédiat. La documentation des séries reste parfois difficile à déchiffrer pour un non-spécialiste. Les métadonnées (définitions, méthodes de calcul, ruptures de série) sont indispensables pour éviter les contresens, mais elles ne sont pas toujours visibles au premier coup d’oeil.

Le volume de données disponibles peut aussi dérouter. L’Insee publie des milliers de séries dans la BDM, et le catalogue ne propose pas encore de moteur de recherche en langage naturel. La navigation suppose de connaître au moins le thème ou le nom de l’indicateur recherché.

L’application mobile Insee Mobile offre un accès simplifié aux indicateurs phares, aux actualités et aux infographies. Elle complète le site sans le remplacer : les extractions automatisées restent l’apanage du service web.

Pour un usager qui débute, le chemin le plus fiable reste de partir d’une publication ou d’un tableau sur le site, de repérer l’identifiant de la série qui l’intéresse, puis de basculer vers le service SDMX uniquement quand le besoin d’automatisation se confirme. Cette progression par paliers évite de se perdre dans une documentation pensée pour des statisticiens.

Plus d’infos