Proposition de création d'une base des Commerces

La base de données ouverte des commerces aurait pour objectif de recenser chaque établissement ouvert au public à vocation commerciale en France dans une base de données géolocalisée et facilement réexploitable.

Le but est de permettre une réexploitation informatisée sans retraitement par tous les acteurs concernés par les commerces :

  • les collectivités locales / CCI / offices du tourisme pour mieux comprendre / gérer les commerces sur leurs territoires
  • les ESN développant des services liés aux commerces
  • les collectivités / organismes nationaux
  • les acteurs universitaires

Il s’agit en particulier d’identifier le type et la position du commerce, ses informations de contact (adresse, numéro de téléphone, site internet …) et d’autres méta-données associées (horaires d’ouverture, accessibilité, modalités de livraison …).

Le numéro SIRET paraît tout indiqué comme identifiant unique partagé entre les différents bases de données. En particulier :

Sources disponibles
Durant la pandémie de Covid19 le projet « Ça Reste Ouvert » visait à répertorier dans OpenStreetMap tous les lieux ouverts au public.

Cela a mené à la publication de la BANCO (BAse Nationale des Commerces Ouverte) publiée à l’adresse https://www.data.gouv.fr/fr/datasets/base-nationale-des-commerces-ouverte dont le périmètre plus précis est détaillé à l’adresse https://wiki.openstreetmap.org/wiki/France/WikiProject_BAse_Nationale_des_Commerces_Ouverte_(BANCO)

Elle contient à ce jour plus de 540 000 commerces géolocalisés, directement issus d’OpenStreetMap. Il est également possible d’en télécharger un extract limité territorialement via l’outil GeoDataMine (https://geodatamine.fr). Bien que prometteur, avec une progression de +9% depuis 12 mois, cette base manque de ré-exploitabilité en l’état.

Par ailleurs, la base de données SIREN éditée par l’INSEE est également disponible en open data https://www.data.gouv.fr/fr/datasets/base-sirene-des-entreprises-et-de-leurs-etablissements-siren-siret mais elle aussi ne permet pas une réutilisation en l’état, dû à la faible réexploitabilité de la classification des établissements, de la géolocalisation et autres.

De nombreux autres sources de données sont actuellement publiées en open data (notamment par les collectivités locales sur leurs site open data respectifs et sur le site data.gouv)

Enfin, la BD topo de l’IGN dispose également de données exploitables.

1 « J'aime »

Je pense qu’il faudrait peut-être se poser la question de savoir si une telle base est ou non un géocommun potentiel (et donc déjà se mettre d’accord sur ce que peut être ou pas un géocommun) avant d’ouvrir une catégorie dédiée sur le forum.

  • Quel périmètre ?
  • Quel seraient le type des contributions attendues ?
  • Par qui ?
  • Quels seraient les réutilisateurs potentiels ?

Pour info, l’INSEE publie depuis peu, un fichier complémentaire à SIRENE qui fournit la géolocalisation des établissements:

Bonjour

Une base des commerces, cela pourrait servir pour faire une base des ERP (attention, les ERP ce ne sont bien sûr pas que les commerces !).
Soyons fous, on pourrait imaginer que l’on pourrait relier cette base à la base de vues immersives libre. En effet, beaucoup de gens utilisent StreetView pour aller voir le restaurant / hôtel / magasin qui les intéresse. Donc si on permet aux commerçants d’enrichir cette base avec les photos de leur commerce, cela donnerait un sacré boost (et on peut remarquer que Google met à jour StreetView surtout là où il y a des commerces).

2 « J'aime »

Je ne sais pas s’il faut inclure ce critère dans la liste de ceux permettant de définir un commun. Ca revient à présager des usages, chose que, notamment côté OSM, on se défend de faire, volontairement. On sait d’expérience qu’il y a les (quelques) usages que chacun peut imaginer de part son expérience, ses connaissances, son imagination, et puis il y a “les autres”, tous ceux auxquels on n’aura pas pensé. Donc à l’extrême, retoquer un candidat à Commun faute de suffisamment d’usages potentiels identifiés par nous ne me paraît pas un critère valable.
L’intérêt que je vois à identifier des usages est juste de penser, au moment d’organiser la donnée, à inclure certaines propriétés afin de ne pas insulter l’avenir, en constatant trop tard qu’on a oublié une propriété essentielle pour l’usage x ou y. En caricaturant : oublier la propriété “nom” pour un commerce ou la propriété “code postal” pour une adresse…

Il y a effectivement un bon potentiel là aussi !

Je voyais plus ça pour se dire que oui, ça intéresse du monde et aussi pour voir à quel point les ré-utilisateurs potentiels peuvent être des contributeurs potentiels. Une façon de mesurer l’écosystème possible autour du commun.

Bonjour,

Je suis convaincu de l’intérêt de cette base.
A partir du Siret, on peut effectivement ajouter pas mal de données qui sont disséminées partout (ou pas exploitées ou mal exploitées ou sur … Google Maps) en faire une base ouverte à destination des collectivités notamment.

Comme le dit @fbecir, la base immersive a évidemment un rôle à jouer autant dans l’alimentation de la base des commerces que comme support de cette même base. C’est tout l’intérêt des communs et des base opendata de se compléter les unes les autres pour aboutir à un effet à heure valeur ajoutée.

Il pourra être fait en temps utiles un travail avec l’Insee pour améliorer à la source le fichier Sirene. Notamment sur l’adressage. mais pour cela, la BAN et l’obligation pour les communes de réaliser l’adressage va aider à ce travail de mis en qualité. Finies les adresses en “ZI du pin” ou “Le Bourg”