On a déjà des outils de rapprochement avec OSM qui sont très efficaces (CtC = Complète tes commerces)
CtC va non seulement chercher dans SIRENE les établissements, leur type, mais aussi dans le BODACC pour retrouver ceux en cours liquidation.
J’ai testé Complète tes commerces, mais je trouve que souvent, on ne peut pas dire s’il y a eu un changement de propriétaires avec les données SIRENE. Une ouverture de magasin est encore plus compliquée à détecter.
Le fait que le nom de l’établissement enregistré dans SIRENE ne soit pas systématiquement le même que le nom renseigné sur OpenStreetMap (il n’a des fois rien à voir) rend souvent le matching compliqué. Autre difficulté, en ville, on a régulièrement jusqu’à une dizaine d’établissements renseignés par adresse, et ce n’est pas toujours possible de savoir le SIRET de l’établissement.
Petit exemple à côté de chez moi à Vincennes :
L’ancien siège social (adresse du coiffeur) est censé avoir fermé et déménagé à Bobigny, et pourtant ce coiffeur est toujours ouvert aujourd’hui.
Un autre exemple, ce magasin a fermé :
On a 7 établissements enregistrés à cette même adresse. Panoramax nous permet de confirmer que c’est bien FOJO qui a remplacé le commerce.
Une validation sur le terrain (ou via Panoramax) me semble indispensable dans la plupart des cas.
La fréquence de prise de photos sur un territoire est très aléatoire, pour que ce que tu proposes soit utile, il faudrait des images très récentes.
Oui, on peut s’intéresser uniquement aux images de moins d’un an.
Les traitements auraient besoin d’être quasi systématiques… cela va être très lourd en terme de calcul et de ressources à mobiliser à terme (si on généralise).
ça je ne suis pas si sûr, pour la détection des devantures, on peut avoir un modèle qui détecte tous les objets d’intérêts sur la photo. Je pense que sur Panoramax, on va avoir besoin d’un second modèle de détection d’objet dans tous les cas, pour détecter tous les objets autres que plaques d’immatriculation et visages, vu que les images à annoter et le jeu de donnée ne peuvent pas être publiques dans le cas du modèle de floutage (vu qu’il y a des données personnelles).
Pour le 2nd modèle d’extraction, on peut se concentrer sur les images en ville (ou en zone rurale dans un périmètre de X m autours de POI OSM déjà ajoutés), ça limite le temps de prédiction.
J’ai un énorme doute sur la capacité à faire ces détections avec une fiabilité suffisante et en particulier à séparer les devantures successives en éléments distincts pour ensuite envisager de les classer.
Sur ce point-là, je n’ai pas trop de doute personnellement, mais à tester 
On peut également avoir un petit classifier léger qui détecte quand deux devantures sont regroupées dans un objet.
Le problème c’est que pour vérifier si un modèle peut donner de bons résultats, il faut l’entraîner et donc faire la partie la plus consommatrice de temps: l’annotation.
Je vais faire quelques tests, et je te tiens au courant de ce que ça donne !
Je n’ai pas trop de doute sur le fait que la détection d’objet puis l’extraction fonctionnent correctement : on a adopté pour Open Prices la même d’approche en deux parties (détection d’objet puis extraction), ça fonctionne très bien. La partie la plus difficile pour moi, c’est de réussir pour chaque commerce détecté à :
- déterminer les coordonnées géographiques du commerce à partir de la photo, de l’objet détecté et des données OSM
- l’heuristique pour savoir si le commerce existe déjà, et dans le cas contraire s’il doit être mis à jour (changement de propriétaire) ou créé